Iawen's Blog

风无形,水无势,互联网没有昼夜。趁这些许的闲暇时光,随手采摘或记录着这知识海洋的点点滴滴......

机器学习入门大纲

机器学习算法有助于从不同数据源收集数据, 转换富数据集的形式, 并基于分析结果, 帮助我们采取明智的行动。机器学习算法是高效、准确的方法, 并提供通用的学习方法来解决各种问题。

数据科学 2025-03-12 18:12:12

deepspeed 入门<一>

DeepSpeed是一个开源深度学习训练优化库, 其中包含的一个新的显存优化技术—— ZeRO(零冗余优化器), 通过扩大规模, 提升速度, 控制成本, 提升可用性, 极大地推进了大模型训练能力。

大模型 2025-03-12 18:12:12

关于 LLM 代理

LLM“代理”可以通过多种方式定义。一些客户将代理定义为完全自主的系统, 这些系统在较长时间内独立运行, 使用各种工具完成复杂的任务。其他人使用该术语来描述遵循预定义工作流的更规范的实施。

大模型 2025-03-12 18:12:12

从概念到代码:揭开 ChatGPT 算法的面纱[转]

在过去的两年里, ChatGPT 和大型语言模型 (LLM) 总体上一直是人工智能领域的大事。已经发表了许多关于如何使用、提示工程和背后的逻辑的文章。尽管如此, 当我开始熟悉 LLM 的算法(所谓的 transformer)时, 我必须浏览许多不同的来源才能感觉自己真正理解了这个主题。

大模型 2025-03-06 20:18:10

LLaMA,开源语言模型

LLaMA是Meta(Facebook)的开源语言模型, 该语言模型据说是比openAI的ChatGPT能力更强的。虽说是开源语言模型, 但如果想要直接使用, 还是需要通过Edu教育邮箱来申请资格的, 得到批复邮件之后, 可以做为科学研究使用

大模型 2025-03-05 17:53:50

finetune 的几种方法和对应框架

给定预训练模型(Pre_trained model),基于模型进行微调(Fine Tune)。相对于从头开始训练(Training a model from scatch), 微调为你省去大量计算资源和计算时间, 提高了计算效率,甚至提高准确率。

大模型 2025-03-04 11:48:38

大模型量化总结

大型语言模型(LLM)通常太大而无法在消费者硬件上运行。这些模型可能超过数十亿个参数, 通常需要具有大量 VRAM 的 GPU 来加速推理。因此, 越来越多的研究集中在通过改进训练、适配器等来缩小这些模型。该领域的一项主要技术称为量化

大模型 2025-03-04 11:48:38

transformers 入门<一>

Huggingface Transformer能够帮我们跟踪流行的新模型, 并且提供统一的代码风格来使用BERT、XLNet和GPT等等各种不同的模型。而且它有一个模型仓库, 所有常见的预训练模型和不同任务上fine-tuning的模型都可以在这里方便的下载。

大模型 2025-03-03 18:30:40

一文带你了解Deepseek

无论是 DeepSeek-v3 还是 DeepSeek-R1, 都以大约 1/20 的成本大大优于 SOTA 模型。DeepSeek R1 是一种可与 OpenAI 的 o1 相媲美但便宜 95% 的模型。

大模型 2025-03-03 18:30:40

PaddleNLP的简介与使用

PaddleNLP 是飞桨自然语言处理开发库, 具备易用的文本领域API, 多场景的应用示例、和高性能分布式训练三大特点, 旨在提升飞桨开发者文本领域建模效率, 旨在提升开发者在文本领域的开发效率, 并提供丰富的NLP应用示例

数据科学 2025-01-03 14:53:13

NLP自然语言处理相关一些知识点汇集<一>

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法

数据科学 2024-08-16 15:53:31

git 操作规范

git的基本操作, 如分支、恢复、提交、日志查看; Git 服务端的创建、通讯协议(本地协议、HTTP、SSH、Git); 本地Git的安装与配置; 使用过程中的一写冲突与问题的解决; 使用Git来代码发布、实现持续集成

服务器管理与架构 2024-05-21 17:54:32

Linux下编译程序

系统设置,环境变量,目标模块,归档生成静态库文件,在x64位Linux上生成动态链接库必须使用编译选项-fPIC的问题,查看依赖库...

编译语言 2024-05-14 19:56:30

select count(*)底层究竟干了啥么

“SELECT COUNT(*) FROM TABLE” 是个再常见不过的 SQL 需求了。在 MySQL 的使用规范中, 我们一般使用事务引擎 InnoDB 作为(一般业务)表的存储引擎, 在此前提下, COUNT(*)操作的时间复杂度为 O(N), 其中 N 为表的行数。

数据库 2024-04-28 17:13:42

MySQL优化指南

当MySQL单表记录数过大时, 增删改查性能都会急剧下降, 所以我们本文会提供一些优化参考, 大家可以参考以下步骤来优化:单表优化,读写分离,缓存,表分区,垂直拆分,水平拆分

数据库 2024-04-28 17:13:42

史上最全SQL优化方案

在进行MySQL的优化之前, 必须要了解的就是MySQL的查询过程, 很多查询优化工作实际上就是遵循一些原则, 让MySQL的优化器能够按照预想的合理方式运行而已

数据库 2024-04-28 17:13:42

MySQL半同步复制

从MySQL5.5开始, MySQL以插件的形式支持半同步复制。如何理解半同步呢?首先我们来看看异步, 全同步的概念.Asynchronous,Fully synchronous,Semisynchronous

数据库 2024-04-28 17:13:42

Memcache与Redis

memcache和redis是互联网分层架构中, 最常用的KV缓存。不少同学在选型的时候会纠结, 到底是选择memcache还是redis。

数据库 2024-04-28 17:13:42

Hbase 集群的搭建与日常操作

hbase是一款分布式的列式数据库, 其数据源寄生在hadoop上, 因而与hadoop共生, 广泛应用在大数据领域, 利用zookeeper作为其分布式协同服务, 存储非结构化和半结构化的松散数据, 其特点是高可靠, 高性能, 面向列, 可伸缩, 实时读写

数据库 2024-04-28 17:13:42

Hbase 集群的常见维护问题

Hadoop 常见问题, Hadoop元数据备份与恢复方案, hbase常见问题及数据备份与迁移, region合并与拆分, Thrift server 参数选择, Phoenix 二级索引等...

数据库 2024-04-28 17:13:42
1 2 3 4 5 6 7