Iawen's Blog

我喜欢这样自由的随手涂鸦, 因为我喜欢风......

Neo4j 入门

Neo4j是一个高性能的,NOSQL图形数据库, 它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎, 但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。

图数据库 2023-11-24 17:07:15

了解科学计算的Python相关基础

科学计算(scientific computing)是指在科学与工程领域, 使用计算机数学建模和数值分析技术分析和解决问题的过程。科学问题包括不同科学学科中的问题, 如地球科学、空间科学、社会科学、生命科学、物理学和形式科学。

数据科学 2023-10-18 17:07:09

使用OpenSSL, 生成各种证书

计算机网络上, OpenSSL是一个开放源代码的软件库包, 应用程序可以使用这个包来进行安全通信, 避免窃听, 同时确认另一端连线者的身份。这个包广泛被应用在互联网的网页服务器上。

安全(WEB与软件) 2023-09-05 22:19:47

常用的NER(Named Entity Recognition)库总结

命名实体识别(Named Entity Recognition, NER)是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。命名实体识别的准确度, 决定了下游任务的效果, 是NLP中非常重要的一个基础问题。

数据科学 2023-07-05 21:43:00

DeepCTR 和 DeepMatch|推荐算法框架

DeepCTR 和 DeepMatch是知乎浅梦大神以及其他大佬开发的针对推荐系统排序召回算法训练推理的一套框架, 支持embedding matrix模块和类似tf estimator 的feature column, 并继承大量排序, 召回已有模型, 能够帮助学生和从业者很快搭建一套推荐算法架构。

数据科学 2023-06-21 15:28:56

埋点设计一二三

埋点是数据领域的专业术语, 它的学名叫事件追踪, 对应的英文是Event Tracking。它主要是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。

服务器管理与架构 2023-06-21 14:45:46

MongoDB 基础与简介

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案.它支持的数据结构非常松散, 是类似json的bson格式, 因此可以存储比较复杂的数据类型...

数据库 2023-06-21 07:37:31

PaddleNLP的简介与使用

PaddleNLP 是飞桨自然语言处理开发库, 具备易用的文本领域API, 多场景的应用示例、和高性能分布式训练三大特点, 旨在提升飞桨开发者文本领域建模效率, 旨在提升开发者在文本领域的开发效率, 并提供丰富的NLP应用示例

数据科学 2023-06-21 07:37:31

Docker 从入门到实践

Docker 支持 Windows/Linux/Mac/AWS/Azure 多种平台的安装, 其中 Windows 需要 Win10+, Mac 需要 EI Captain+。Docker 是一个 C/S 架构的服务, 安装好 docker 之后需要启动 docker 软件后才能使用 docker 命令。Docker 软件包已经包括在默认的 CentOS-Extras 软件源里。因此想要安装 docker, 只需要运行下面的 yum 命令.

服务器管理与架构 2023-06-01 15:46:19

深度学习中常见的数据处理方法

数据作为三者之中不容易用标准化的元素来说, 其不可控的原因主要是由于不同的任务要使用不同的数据集, 所以很难对数据做到真正的标准化和模块化, 无法像算法模型一样直接对其调用。

数据科学 2023-06-01 15:46:19

Samba 简介与基本使用

Samba是在Linux系统上实现SMB(Session MessageBlock)协议的一个免费软件, 以实现文件共享和打印机服务共享, 是模仿Windows网上邻居的SMB的通讯协议, 将Linux操作系统"假装成"Windows操作系统, 通过网上邻居的方式来进行文件传输的。

常用工具说明篇 2023-06-01 15:46:19

Nginx的rewrite、全局变量、重定向和防盗链等相关功能

Nginx的负载均衡可以把用户的请求分摊到多个服务器上进行处理, 从而实现了对海量用户的访问支持。Nginx服务器利用ngx_http_rewrite_module 模块解析和处理rewrite请求

服务器管理与架构 2023-05-21 19:54:59

推荐系统及相关算法简介

随着信息技术和互联网的发展, 人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。推荐系统的任务就是联系用户和信息, 一方面帮助用户发现对自己有价值的信息, 另一方面让信息能够展现在对它感兴趣的用户面前, 从而实现信息消费者和信息生产者的双赢。

数据科学 2023-05-21 19:54:59

NLP自然语言处理相关一些知识点汇集<一>

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法

数据科学 2023-03-05 09:22:44

一文了解什么是RPA

RPA, 即Robotic Process Automation(机器人流程自动化), 是以机器人作为虚拟劳动力, 依据预先设定的程序与现有用户系统进行交互并完成预期的任务。通俗的讲, RPA机器人就是借助一些能够自动执行的脚本

数据科学 2023-03-05 09:22:44

Kafka入门与基本参数设置

Kafka 是一个消息系统, 原本开发自 LinkedIn, 用作 LinkedIn 的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。现在它已被多家不同类型的公司 作为多种类型的数据管道和消息系统使用

服务器管理与架构 2022-12-05 17:38:10

Linux下的文件查找

Linux下的文件查找主要是通过find 或 grep 命令, 如按文件大小、时间、权限来查找, 或按文件名称正则来查找等, 也可以结合其他命令来一边查找一边处理...

操作系统 2022-11-21 14:40:25

Linux sendmail 详解

邮件服务器构成了电子邮件系统的核心。每个收信人都有一个位于某个邮件服务器上的邮箱(mailbox)。首先, 当你将E-mail输入你的计算机开始发送时, 计算机会根据SMTP协议和TCP/IP协议的要求将你的信“打包”

操作系统 2022-11-21 14:40:25

systemd.service详细配置说明

systemd即为system daemon, 是linux下的一种init软件,由Lennart Poettering带头开发, 并在LGPL 2.1及其后续版本许可证下开源发布,开发目标是提供更优秀的框架以表示系统服务间的依赖关系, 并依此实现系统初始化时服务的并行启动, 同时达到降低Shell的系统开销的效果, 最终代替现在常用的System V与BSD风格init程序。

操作系统 2022-11-21 14:40:25

SQL优化

在多数情况下, Oracle使用索引来更快地遍历表, 优化器主要根据定义的索引来提高性能。但是, 如果在SQL语句的where子句中写的SQL代码不合理, 就会造成优化器删去索引而使用全表扫描, 一般就这种SQL语句就是所谓的劣质SQL语句。在编写SQL语句时我们应清楚优化器根据何种原则来删除索引, 这有助于写出高性能的SQL语句。

数据库 2022-11-21 14:40:25
1 2 3 4 5 6