未分类 现代大语言模型采样入门指南 《》,一篇长文,系统介绍了LLM中的文本生成采样技术。 文章从基础的token化原理(如为何使用子词、BPE和SentencePiece分词方法)讲起,详细解析了各类采样策略(如温度调节、Top-K、Top-P、重复惩罚等)及其对生成结果
开源项目 Attentive Reasoning Queries(ARQ)”的新推理方法介绍 最近,一种名为“Attentive Reasoning Queries(ARQ)”的新推理方法被开源,显著减少了大型语言模型(LLM)中的幻觉问题,成功率高达90.2%,超过了广泛使用的Chain-of-Thought(CoT)等技术。
无分类 如何用AI一天读完一本书,并真正学会作者的思维框架和系统,而非简单速读? 如何用AI一天读完一本书,并真正学会作者的思维框架和系统,而非简单速读?|1. 获取书籍,PDF格式最佳,epub等也可。关键不是格式,而是后续处理方式。 2. 大部分人犯的错误:把整本400页以上的书一次性上传给AI,期待完美总结,结果
无分类 Anthropic 推出 Claude Code 网页版 Anthropic 推出,开发者无需打开终端即可委托 AI 处理编程任务。支持多任务并行执行,方便管理 Bug 积压、日常修复和并行开发,极大提升工作效率。 目前处于 Pro 和 Max 用户的测试预览阶段,期待更多反馈和优化。此举标志着
无分类 Claude生态三大核心:Skills、Subagents和Projects区别 Claude生态三大核心:Skills、Subagents和Projects区别 |- Skills是Claude的基础技能模块,类似工具包,专注单一功能。 – Subagents则是具备独立任务能力的小代理,可以调用多个Skills协
无分类 What makes documentation good 一篇好的文档,核心在于将有用信息准确传递给读者。优秀文档的关键在于易读、简明且具条理,能有效减少读者的搜索时间,提升解决问题的效率。 首先,文档要便于快速浏览。通过清晰的章节标题指引读者,优先使用带信息量的标题而非抽象名词,比如“Stre
开源项目 腾讯混元团队开源了Hunyuan World 1.1(WorldMirror) 腾讯混元团队开源了Hunyuan World 1.1(WorldMirror),一款通用的前馈式3D重建模型。相比之前的1.0版本(支持文本或单视角图像生成3D世界,轻量级可部署于消费级GPU),1.1版本大幅拓展了输入范围,支持视频到3D