Iawen's Blog

风无形,水无势,互联网没有昼夜。趁这稍许的闲暇时光,随手采摘或记录着这知识海洋的点点滴滴......

MongoDB 基础与简介

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案.它支持的数据结构非常松散, 是类似json的bson格式, 因此可以存储比较复杂的数据类型...

数据库 2023-06-21 07:37:31

深度学习中常见的数据处理方法

数据作为三者之中不容易用标准化的元素来说, 其不可控的原因主要是由于不同的任务要使用不同的数据集, 所以很难对数据做到真正的标准化和模块化, 无法像算法模型一样直接对其调用。

数据科学 2023-06-01 15:46:19

Samba 简介与基本使用

Samba是在Linux系统上实现SMB(Session MessageBlock)协议的一个免费软件, 以实现文件共享和打印机服务共享, 是模仿Windows网上邻居的SMB的通讯协议, 将Linux操作系统"假装成"Windows操作系统, 通过网上邻居的方式来进行文件传输的。

常用工具说明篇 2023-06-01 15:46:19

Nginx的rewrite、全局变量、重定向和防盗链等相关功能

Nginx的负载均衡可以把用户的请求分摊到多个服务器上进行处理, 从而实现了对海量用户的访问支持。Nginx服务器利用ngx_http_rewrite_module 模块解析和处理rewrite请求

服务器管理与架构 2023-05-21 19:54:59

推荐系统及相关算法简介

随着信息技术和互联网的发展, 人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。推荐系统的任务就是联系用户和信息, 一方面帮助用户发现对自己有价值的信息, 另一方面让信息能够展现在对它感兴趣的用户面前, 从而实现信息消费者和信息生产者的双赢。

数据科学 2023-05-21 19:54:59

一文了解什么是RPA

RPA, 即Robotic Process Automation(机器人流程自动化), 是以机器人作为虚拟劳动力, 依据预先设定的程序与现有用户系统进行交互并完成预期的任务。通俗的讲, RPA机器人就是借助一些能够自动执行的脚本

数据科学 2023-03-05 09:22:44

Kafka入门与基本参数设置

Kafka 是一个消息系统, 原本开发自 LinkedIn, 用作 LinkedIn 的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。现在它已被多家不同类型的公司 作为多种类型的数据管道和消息系统使用

服务器管理与架构 2022-12-05 17:38:10

Linux下的文件查找

Linux下的文件查找主要是通过find 或 grep 命令, 如按文件大小、时间、权限来查找, 或按文件名称正则来查找等, 也可以结合其他命令来一边查找一边处理...

操作系统 2022-11-21 14:40:25

Linux sendmail 详解

邮件服务器构成了电子邮件系统的核心。每个收信人都有一个位于某个邮件服务器上的邮箱(mailbox)。首先, 当你将E-mail输入你的计算机开始发送时, 计算机会根据SMTP协议和TCP/IP协议的要求将你的信“打包”

操作系统 2022-11-21 14:40:25

systemd.service详细配置说明

systemd即为system daemon, 是linux下的一种init软件,由Lennart Poettering带头开发, 并在LGPL 2.1及其后续版本许可证下开源发布,开发目标是提供更优秀的框架以表示系统服务间的依赖关系, 并依此实现系统初始化时服务的并行启动, 同时达到降低Shell的系统开销的效果, 最终代替现在常用的System V与BSD风格init程序。

操作系统 2022-11-21 14:40:25

SQL优化

在多数情况下, Oracle使用索引来更快地遍历表, 优化器主要根据定义的索引来提高性能。但是, 如果在SQL语句的where子句中写的SQL代码不合理, 就会造成优化器删去索引而使用全表扫描, 一般就这种SQL语句就是所谓的劣质SQL语句。在编写SQL语句时我们应清楚优化器根据何种原则来删除索引, 这有助于写出高性能的SQL语句。

数据库 2022-11-21 14:40:25

安装MySQL与基本配置

MySQL的安装包安装与源码编译安装, 配置文件my.cnf的一下基本设置, 锁表的查看, 主从的基本配置以及系统帐号和权限设置, 密码与授权、重置密码等.MySql最左前缀原则,MySQL缓存

数据库 2022-11-21 14:40:25

hbase基本配置及其各种性能调整参数配置

HBase是一个分布式的、面向列的开源数据库, 该技术来源于 Fay Chang 所撰写的Google论文“Bigtable: 一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样, HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。

数据库 2022-11-21 14:40:25

Thrift和HBase 性能评价分析置

Thrift是Facebook开源出来的通信服务框架, 典型的C/S架构模式, 支持跨语言编程, 例如Java, C++, Python等主流语言, 能够友好地解决各大系统的数据通信问题和多种语言运行环境不同所引起的信息交互问题。Thrift采用一种IDL编码通信的方式, 跟业界在以前通常采用的CORBA通信协议标准方式有点类似。它通过创建IDL文件, 生成并编写相关代码文件, 实现其相关的代码, 编译装载即可使用。

数据库 2022-11-21 14:40:25

数据库两大必备神器: 索引和锁底层原理是什么!

主要介绍了数据库中的两个比较重要的知识点: 索引和锁。他俩可以说息息相关的, 锁会涉及到很多关于索引的知识...哈希索引,聚集和非聚集索引,索引最左匹配原则,乐观锁和悲观锁,间隙锁GAP等

数据库 2022-11-21 14:40:25

Thrift API And Filter Language

使用Get或Scan操作从HBase读取数据时, 可以使用自定义过滤器将结果的子集返回给客户端. 虽然这不会减少服务器端IO, 但确实会减少网络带宽并减少客户端需要处理的数据量. 过滤器通常使用Java API使用, 但可以从HBase Shell中使用以进行测试和调试.

数据库 2022-11-21 14:40:25

MySQL数据库经典错误案例

列举 MySQL数据库中, 最经典的错误案例, 如: 连接过多, 主从复制报错, 密码忘记, 自动清空自增ID, 中文乱码, 连接超时, 不能打开数据库文件等......

数据库 2022-11-21 14:40:25

初窥 Dgraph Alpha代码 之 Query 流程

初窥 Dgraph Alpha代码, 一是为了熟悉Dgraph Alpha的运作流程, 二是为以后的自行扩展做准备, 所以略过一些具体操作细节和算法, 留待以后深入, 同时对结构体的具体作用没有深挖。

图数据库 2022-11-21 14:40:25

WiscKey: Separating Keys from Values in SSD-Conscious Storage [归拢]

WiscKey是一个基于LSM的KV存储引擎, 特点是: 针对SSD的顺序和随机读写都高效的特点, Key和Value分开存储以最小化IO放大效应。YCSB场景中它比LevelDB和RocksDB都快。

图数据库 2022-11-21 14:40:25

badger 简介

badger 是 dgraph 开源的 LSMTree 的 KV 引擎, 它相比 leveldb 有 KV 分离、事务、并发合并等增强, 是 go 生态中比较生产级的存储引擎了。

图数据库 2022-11-21 14:40:25
1 2 3 4 5 6 7