AI

AI
AIAI写作助手,一个基于Next.js的工具,支持多种LLM,可定制写作风格并生成高质量内容
AI写作助手是一个基于Next.js构建的工具,通过AI技术提升写作效率和质量。 AI写作助手允许用户通过详细的提示词风格编辑器定制写作风格,支持多种大型语言模型(LLM)API,如OpenAI、Anthropic Claude、Google Gemini、Groq、Ollama和Grok。 AI写作助手提供实时内容编辑、Markdown导出、详细调试信息和主题切换等功能。通过API设置选择模型和配置密钥后,用户可以设定文章主题、关键词和字数,定制风格,然后生成内容、编辑和导出。 丰富的写作风格定制:详
AI
AI
AICherry Studio 一站式AI工具客户端,支持多平台与本地知识库搭建
日常使用AI工具时,往往需要打开多个网页,操作繁琐。Cherry Studio 是一款功能强大的客户端工具,支持 Windows、Mac 和 Linux 系统,集成了多种大模型和实用功能,简化了AI工具的使用流程。 支持多种大模型与功能 Cherry Studio 支持 OpenAI、DeepSeek、Kimi 等国内外十几种大模型平台。例如,当 DeepSeek 网页服务器繁忙时,可通过第三方 API 轻松解决问题。Cherry Studio还支持文生图、翻译功能,以及本地知识库的搭建。 配置大模型
AI
AITrace-and-Verify (Traver):LLM编程辅导工具,支持知识追踪与个性化教学
Coding-Tutor 基于大语言模型的编程辅导研究,通过知识追踪与逐步验证的工作流程,解决编程辅导场景中用户背景知识差异带来的教学适配问题。该方法不仅适用于编程辅导,也可扩展至其他需要个性化教学的任务场景。 项目开发了DICT评估协议,结合模拟学生与编程测试双重机制。该协议支持自动化评估流程,为教学代理的迭代开发提供系统化验证框架。实验数据显示,不同水平的模拟学生在完成相同编程任务时展现出显著的能力差异。 1、推理扩展性:Traver工作流配合验证模块,在编程辅导场景中展现出可扩展的推理能力 2、数
AI
AIDeepSeek RAG Chatbot 3.0:本地安装,支持GraphRAG,快速检索PDF/DOCX/TXT文档信息
DeepSeek RAG Chatbot 3.0是一个功能强大的聊天机器人,支持本地安装,无需互联网连接,集成了GraphRAG和聊天历史记录功能,能够快速、准确且可解释地从PDF、DOCX和TXT文档中检索信息。 DeepSeek RAG Chatbot 3.0 核心功能 本地化部署:无需网络连接,支持PDF/DOCX/TXT文档处理 混合检索架构:整合DeepSeek-7B、BM25、FAISS、Neural Reranking多模块 新增知识图谱构建:GraphRAG技术解析文档关联性 对话记忆功
AI
AIolmOCR PDF解析工具,支持ChatGPT 4与海量文档处理
olmOCR是一个用于处理复杂PDF文档的工具包,由艾伦人工智能研究所(AI2)开发。 olmOCR利用大型语言模型(例如ChatGPT 4)对PDF文档进行自然文本解析。olmOCR并非简单的OCR,而是整合了多种技术,包括:巧妙的提示策略以获得高质量的文本解析;用于比较不同处理流程版本的评估工具;基于语言和SEO垃圾内容的过滤功能;针对特定模型(如Qwen2-VL和Molmo-O)的微调代码;以及使用Sglang进行大规模PDF处理的流水线工具。 olmOCR支持本地和多节点(集群)运行,尤其适合处
AI
AIControl Plane For Your AI Agents (基于 mahilo 框架) :一个用于构建和管理多智能体系统的框架
Mahilo是腾讯开源的创新型多智能体协作框架,支持创建具备人机协同能力的智能体团队。Mahilo框架允许不同来源的智能体(包括其他框架创建的智能体)在统一平台中实现信息共享与协作,并始终保持人类监督者的控制权。 创建或注册多种智能体 可以基于框架自带的BaseAgent创建新的智能体,也可以集成其他框架(如LangGraph)中的智能体。 构建智能体团队 将这些智能体组合成一个团队,让他们可以相互交流、共享信息。 实现人机协作 (Human-in-the-Loop) 通过客户端连接到每个智能体,进行实
AI
AI
AIAgent Leaderboard:评估AI在真实商业场景中利用工具的能力,使用TSQ指标衡量模型表现并提供排行榜
聚焦真实商业场景的Agent Leaderboard通过系统性评估,揭示大语言模型在复杂工具调用场景中的实战能力,最新排名可通过 https://huggingface.co/spaces/galileo-ai/agent-leaderboard 实时查看。 评估体系四重奏 1、模型筛选 覆盖12个闭源模型+5个开源模型,构建多元化评估矩阵 2、标准化配置 统一系统提示词 工具调用权限标准化 零温度设置确保评估一致性 3、数据精选策略 从四大标杆数据集中战略采样: BFCL(教育/学术场景) τ-ben
AI
AIWan2.1 开源视频生成模型,支持多种任务和分辨率
Wan2.1 是一套全面开放的视频生成模型,采用主流的扩散变换器(diffusion transformer)范式,支持多任务处理和高分辨率生成,同时兼容消费级GPU。 核心功能 1、SOTA性能在多个基准测试中超越现有开源模型和商业解决方案。 支持生成中英文视觉文本(如视频中的文字嵌入)。 2、低硬件门槛T2V-1.3B模型仅需8.19GB显存,可在RTX 4090上4分钟生成5秒480P视频(未优化)。 14B模型支持多GPU分布式推理(FSDP + xDiT USP技术)。 3、多任务支持文本生成
AI
AIClaude Code 终端智能编码助手
Claude Code 是一个终端编码工具,通过自然语言命令帮助开发者更快地执行常规任务和处理代码。 Claude Code集成在终端中,能够理解代码库,通过自然语言命令执行常规任务、解释复杂代码以及处理 Git 工作流。 Claude Code主要功能: 编辑文件和修复代码库中的错误 解答关于代码架构和逻辑的问题 执行和修复测试、代码检查及其他命令 通过自然语言指令执行编码任务 支持跨代码库的文件编辑和错误修复 解释复杂代码逻辑和架构 执行测试用例并修复相关问题 处理git工作流(合并冲突/提交/PR
AI
AIDeepSeek开源FlashMLA:针对Hopper GPU优化的高效MLA解码内核
高效性能:FlashMLA采用了一系列优化算法,可以显著提高模型的训练速度和推理效率。这使得研究人员和企业能够在更短的时间内获得更好的结果。 易于使用:项目提供了清晰的文档和示例,用户可以轻松上手,无需深入的技术背景就能使用其功能。 灵活性:FlashMLA支持多种深度学习框架,用户可以根据自己的需求自由选择使用的工具,使得它在不同的应用场景中更具适应性。 社区支持:作为一个开源项目,FlashMLA鼓励开发者参与其中,贡献代码和想法,从而不断推动项目的进步。 FlashMLA适用于多个领域,包括但不限