Hbase 集群的搭建与日常操作
hbase是一款分布式的列式数据库, 其数据源寄生在hadoop上, 因而与hadoop共生, 广泛应用在大数据领域, 利用zookeeper作为其分布式协同服务, 存储非结构化和半结构化的松散数据, 其特点是高可靠, 高性能, 面向列, 可伸缩, 实时读写
数据库 2024-04-28 17:13:42
Hbase 集群的常见维护问题
Hadoop 常见问题, Hadoop元数据备份与恢复方案, hbase常见问题及数据备份与迁移, region合并与拆分, Thrift server 参数选择, Phoenix 二级索引等...
数据库 2024-04-28 17:13:42
MySQL、MongoDB、Redis 数据库之间的区别
NoSQL 的全称是 Not Only SQL, 也可以理解非关系型的数据库, 是一种新型的革命式的数据库设计方式, 不过它不是为了取代传统的关系型数据库而被设计的, 它们分别代表了不同的数据库设计思路(MySQL, MongoDB, Redis...)
数据库 2024-04-28 17:13:42
PostgreSQL 入门与基本操作
PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS), 在灵活的BSD许可证下发行。PostgreSQL 开发者把它念作 post-gress-Q-L。PostgreSQL 的 Slogan 是'世界上最先进的开源关系型数据库'。
数据库 2024-04-28 17:13:42
Dgraph 入门与学习
DGraph 是由前 Google 员工 Manish Rai Jain 离职创业后, 在 2016 年推出的图数据库产品, 基于 Go 语言编写, 底层数据模型是 RDF, 存储引擎基于 BadgerDB 改造, 使用 RAFT 保证数据读写的强一致性...
图数据库 2024-04-28 17:13:42
Elasticsearch 7.4 手册阅读笔记
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎, 基于RESTful web接口。Elasticsearch是用Java语言开发的, 并作为Apache许可条款下的开放源码发布, 是一种流行的企业级搜索引擎。
服务器管理与架构 2024-04-28 17:13:42
分布式文件系统glusterfs部署搭建
GlusterFS是Scale-Out存储解决方案Gluster的核心, 它是一个开源的分布式文件系统, 具有强大的横向扩展能力, 通过扩展能够支持数PB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBandRDMA网络将物理分布的存储资源聚集在一起, 使用单一全局命名空间来管理数据。
服务器管理与架构 2024-04-28 17:13:42
Websocket与Socker.IO比较与分析
为什么socketio不能兼容websocket呢?作为一名合格的工程师, 不能知其然而不知其所以然, websocket是什么, 它与socket.io有什么区别呢?他们又分别适合怎样的场景?为什么有了websocket还需要有socket.io?
服务器管理与架构 2024-04-28 17:13:42
NGINX和NGINX Plus的速率限制
NGINX最有用但经常被误解和配置错误的功能之一是速率限制。它允许您限制用户在给定时间段内可以发出的HTTP请求的数量。请求可以很简单, 例如GET对网站首页的POST请求或登录表单上的请求。
服务器管理与架构 2024-04-28 17:13:42
常见IoT协议最全讲解与搭建
物联网(Internet of Things)这个概念读者应该不会陌生。物联网的概念最早于1999年被提出来, 曾被称为继计算机、互联网之后, 世界信息产业发展的第三次浪潮, 到现在已经发展了20余年。
服务器管理与架构 2024-04-28 17:13:42
Etcd 使用入门
etcd是CoreOS团队于2013年6月发起的开源项目, 它的目标是构建一个高可用的分布式键值(key-value)数据库。etcd内部采用raft协议作为一致性算法, etcd基于Go语言实现
服务器管理与架构 2024-04-28 17:13:42
RabbitMQ 基础与简介
RabbitMQ是实现了高级消息队列协议(AMQP)的开源消息代理软件(亦称面向消息的中间件)。RabbitMQ服务器是用Erlang语言编写的, 而聚类和故障转移是构建在开放电信平台框架上的。所有主要的编程语言均有与代理接口通讯的客户端库。
服务器管理与架构 2024-04-28 17:13:42
分布式锁的基本实现原理与基于etcd 分布式锁的实现
分布式锁和我们平常讲到的锁原理基本一样, 目的就是确保在多个线程并发时, 只有一个线程在同一刻操作这个业务或者说方法、变量。
服务器管理与架构 2024-04-28 17:13:42
Web 的常用攻击方式说明
CSRF(Cross-site request forgery), 中文名称: 跨站请求伪造, 也被称为: one click attack/session riding, 缩写为: CSRF/XSRF。那么CSRF到底能够干嘛呢?你可以这样简单的理解: 攻击者可以盗用你的登陆信息, 以你的身份模拟发送各种请求。
安全(WEB与软件) 2024-04-28 17:13:42
Linux 网络配置
常用网络配置和经网络检测, 包含: network, ip, sysctl, iptables, lsof, netstat, slabtop等
安全(WEB与软件) 2024-04-28 17:13:42
Linux 防火墙设置
防火墙设置。主要使用iptables, iptables 是一个通过控制 Linux 内核的 netfilter 模块来管理网络数据包的流动与转送的应用软件, 其功能包括不仅仅包括防火墙的控制出入流量, 还有端口转发等等。 尽量避免ufw与iptables同时使用
安全(WEB与软件) 2024-04-28 17:13:42
深入研究Pass-the-Hash攻击与防御(转载)
20多年来, 攻击者一直在使用传递散列(Pass-the-Hash, PtH)攻击, 为了防御这种攻击, Windows设计发生了几个变化。这些变化影响了攻击的可行性、攻击工具的有效性。与此同时攻击技术也在提高, 出现了新的PtH攻击方法。本Paper研究了各种方法的哈希提取、各种方法执行PtH攻击(列出攻击的先决条件)、PtH防御建议。
安全(WEB与软件) 2024-04-28 17:13:42
文本相似度总结<一>
工业界的很多应用都有在语义上衡量文本相似度的需求, 我们将这类需求统称为“语义匹配”。从传统的无监督相似度方法, 到孪生模型, 交互式模型, BERT, 以及基于BERT的一些改进工作.总体来说, 在BERT出现之前, 文本相似度任务可以说是一个百花齐放的过程。
数据科学 2024-04-28 17:13:42
Linux tcpdump命令详解
用简单的话来定义tcpdump, 就是: dump the traffic on a network, 根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤, 并提供and、or、not等逻辑语句来帮助你去掉无用的信息。Wireshark