Iawen's Blog

我喜欢这样自由的随手涂鸦, 因为我喜欢风......

OpenCV学习笔记<一>

OpenCV是一个开源程序库, 包含了500多个用于图像和视频分析的优化算法。该程序库建立于1999年, 目前在计算机视觉领域的研发人员社区中非常流行, 被用作主要开发工具。

编译语言 2024-10-06 19:41:02

Embedding与向量数据库总结

Embedding 的基本内容大概就是这么多啦, 然而小普想说的是它的价值并不仅仅在于 word embedding 或者 entity embedding 再或者是多模态问答中涉及的 image embedding, 而是这种能将某类数据随心所欲的操控且可自学习的思想。

数据科学 2024-09-25 17:22:56

大模型LLM 的基准测试<一>

LLMs的不可思议的能力可以推广到广泛的NLP任务,这要求研究人员设计全面的评估基准,以有效地测试他们在各种任务上的能力。这些基准测试应该涵盖 LLM 的全部功能,同时足够简单,易于管理和解释。

大模型 2024-09-25 17:22:56

RAG 入门<一>

RAG 顾名思义就是: Retrieval Augmented Generation, 即使用 LLM 生成, 它由严格编程的自动化流程或代理辅助的自动化流程辅助, 这些流程收集、操作并向系统提供数据。RAG 不是 Vector DB 技术,而是一个定义松散的概念,描述了自动化系统协助 LLM 生成的过程,并且可以使用数据库(如 vector dbs、sql dbs 甚至普通文件)来增强其操作。

大模型 2024-09-25 17:22:56

大模型量化总结

大型语言模型(LLM)通常太大而无法在消费者硬件上运行。这些模型可能超过数十亿个参数, 通常需要具有大量 VRAM 的 GPU 来加速推理。因此, 越来越多的研究集中在通过改进训练、适配器等来缩小这些模型。该领域的一项主要技术称为量化

大模型 2024-09-11 08:30:06

大模型推理与部署框架

大模型的推理与部署框架越来越多,如vllm、lmdeploy、llamm.cpp等,但各种的支持不同、更新的频率不一,在生成部署时,还是要按需选择合适的框架。

大模型 2024-09-11 08:14:33

Python常用模块介绍与使用说明

Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆 于1990 年代初设计, 作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构, 还能简单有效地面向对象编程。Python语法和动态类型, 以及解释型语言的本质......

脚本语言 2024-09-08 18:32:22

PaddleNLP的简介与使用

PaddleNLP 是飞桨自然语言处理开发库, 具备易用的文本领域API, 多场景的应用示例、和高性能分布式训练三大特点, 旨在提升飞桨开发者文本领域建模效率, 旨在提升开发者在文本领域的开发效率, 并提供丰富的NLP应用示例

数据科学 2024-09-06 19:55:29

大模型功能简介以及对应工具整理

大型语言模型是深度学习神经网络, 可以通过对大量文本进行训练来理解、处理和生成人类语言。LLM(Large Language Model) 可以归类为自然语言处理(NLP), 这是一个旨在理解、解释和生成自然语言的人工智能领域。

大模型 2024-09-02 07:57:15

NLP自然语言处理相关一些知识点汇集<一>

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法

数据科学 2024-08-16 15:53:31

finetune 的几种方法和对应框架

给定预训练模型(Pre_trained model),基于模型进行微调(Fine Tune)。相对于从头开始训练(Training a model from scatch),微调为你省去大量计算资源和计算时间,提高了计算效率,甚至提高准确率。

大模型 2024-06-24 08:41:05

transformers 入门<一>

Huggingface Transformer能够帮我们跟踪流行的新模型, 并且提供统一的代码风格来使用BERT、XLNet和GPT等等各种不同的模型。而且它有一个模型仓库, 所有常见的预训练模型和不同任务上fine-tuning的模型都可以在这里方便的下载。

大模型 2024-06-14 20:59:51

git 操作规范

git的基本操作, 如分支、恢复、提交、日志查看; Git 服务端的创建、通讯协议(本地协议、HTTP、SSH、Git); 本地Git的安装与配置; 使用过程中的一写冲突与问题的解决; 使用Git来代码发布、实现持续集成

服务器管理与架构 2024-05-21 17:54:32

Linux下编译程序

系统设置,环境变量,目标模块,归档生成静态库文件,在x64位Linux上生成动态链接库必须使用编译选项-fPIC的问题,查看依赖库...

编译语言 2024-05-14 19:56:30

初次接触深度学习<一>

深度学习是机器学习的一个分支领域:它是从数据中学习表示的一种新方法, 强调从连续的层(layer)中进行学习, 这些层对应于越来越有意义的表示。"深度学习"中的"深度"指的并不是利用这种方法所获取的更深层次的理解, 而是指一系列连续的表示层。

数据科学 2024-05-02 21:07:13

select count(*)底层究竟干了啥么

“SELECT COUNT(*) FROM TABLE” 是个再常见不过的 SQL 需求了。在 MySQL 的使用规范中, 我们一般使用事务引擎 InnoDB 作为(一般业务)表的存储引擎, 在此前提下, COUNT(*)操作的时间复杂度为 O(N), 其中 N 为表的行数。

数据库 2024-04-28 17:13:42

MySQL优化指南

当MySQL单表记录数过大时, 增删改查性能都会急剧下降, 所以我们本文会提供一些优化参考, 大家可以参考以下步骤来优化:单表优化,读写分离,缓存,表分区,垂直拆分,水平拆分

数据库 2024-04-28 17:13:42

史上最全SQL优化方案

在进行MySQL的优化之前, 必须要了解的就是MySQL的查询过程, 很多查询优化工作实际上就是遵循一些原则, 让MySQL的优化器能够按照预想的合理方式运行而已

数据库 2024-04-28 17:13:42

MySQL半同步复制

从MySQL5.5开始, MySQL以插件的形式支持半同步复制。如何理解半同步呢?首先我们来看看异步, 全同步的概念.Asynchronous,Fully synchronous,Semisynchronous

数据库 2024-04-28 17:13:42

Memcache与Redis

memcache和redis是互联网分层架构中, 最常用的KV缓存。不少同学在选型的时候会纠结, 到底是选择memcache还是redis。

数据库 2024-04-28 17:13:42
1 2 3 4 5 6