AI

AI
AIManus邀请码申请指南
Manus采用多智能体协同架构,在虚拟机环境中实现工具调用、代码执行和跨平台操作的无缝衔接。Manus核心创新在于任务分解引擎,能够将复杂指令如“筛选纽约房产”拆解为数据采集、预算计算、风险评估等超过15个子任务,通过动态负载分配实现高效并行处理。 Manus的记忆强化系统能够自动记录用户偏好,例如Excel输出格式,并在后续任务中优先应用历史决策模式,提升操作效率。沙箱执行环境在隔离虚拟机中完成文件解压、网页浏览等高危操作,保障系统安全性。 在GAIA基准测试中,Manus以92%的任务完成度和85%
AI
AI
AIOpenChat全栈聊天应用,AI驱动,支持Web、移动和桌面端
OpenChat 是一个现代化的 AI 聊天应用,它使用 React 和多后端架构(Cloudflare Workers/Node.js/Golang)构建,提供 Web、移动 App 和桌面端全平台客户端。 全栈 TypeScript:前后端类型安全,提高开发效率。 极速部署:基于 Cloudflare Workers,实现一键全球部署。 全平台无缝同步:网页、手机、电脑三端数据实时同步,随时随地无缝切换,继续您的对话。 完整包装:开箱即用的完整功能,无需额外配置。 高度可扩展:易于添加新模型和功能的
AI
AI阿里开源QwQ-32B:轻量级推理模型,科学推理接近研究生水平
阿里开源了QwQ-32B,是拥有320亿参数的推理模型,性能可与6710亿参数的DeepSeek-R1相媲美。QwQ-32B展示了接近研究生水平的科学推理能力,尤其在数学推理和编程问题上表现突出。 强化学习的优势强化学习(RL)在基础模型中的应用前景广阔。相比传统的监督学习,RL允许模型通过试错和反馈不断优化推理策略,特别适合需要多步推理、答案明确的任务。例如,有研究通过大规模RL探索链式思维(CoT),模型自发涌现出自我验证、反思和长推理链等能力。 QwQ-32B的训练过程阿里在QwQ-32B的训练中
AI
AIAI写作助手,一个基于Next.js的工具,支持多种LLM,可定制写作风格并生成高质量内容
AI写作助手是一个基于Next.js构建的工具,通过AI技术提升写作效率和质量。 AI写作助手允许用户通过详细的提示词风格编辑器定制写作风格,支持多种大型语言模型(LLM)API,如OpenAI、Anthropic Claude、Google Gemini、Groq、Ollama和Grok。 AI写作助手提供实时内容编辑、Markdown导出、详细调试信息和主题切换等功能。通过API设置选择模型和配置密钥后,用户可以设定文章主题、关键词和字数,定制风格,然后生成内容、编辑和导出。 丰富的写作风格定制:详
AI
AICherry Studio 一站式AI工具客户端,支持多平台与本地知识库搭建
日常使用AI工具时,往往需要打开多个网页,操作繁琐。Cherry Studio 是一款功能强大的客户端工具,支持 Windows、Mac 和 Linux 系统,集成了多种大模型和实用功能,简化了AI工具的使用流程。 支持多种大模型与功能 Cherry Studio 支持 OpenAI、DeepSeek、Kimi 等国内外十几种大模型平台。例如,当 DeepSeek 网页服务器繁忙时,可通过第三方 API 轻松解决问题。Cherry Studio还支持文生图、翻译功能,以及本地知识库的搭建。 配置大模型
AI
AITrace-and-Verify (Traver):LLM编程辅导工具,支持知识追踪与个性化教学
Coding-Tutor 基于大语言模型的编程辅导研究,通过知识追踪与逐步验证的工作流程,解决编程辅导场景中用户背景知识差异带来的教学适配问题。该方法不仅适用于编程辅导,也可扩展至其他需要个性化教学的任务场景。 项目开发了DICT评估协议,结合模拟学生与编程测试双重机制。该协议支持自动化评估流程,为教学代理的迭代开发提供系统化验证框架。实验数据显示,不同水平的模拟学生在完成相同编程任务时展现出显著的能力差异。 1、推理扩展性:Traver工作流配合验证模块,在编程辅导场景中展现出可扩展的推理能力 2、数
AI
AI
AIDeepSeek RAG Chatbot 3.0:本地安装,支持GraphRAG,快速检索PDF/DOCX/TXT文档信息
DeepSeek RAG Chatbot 3.0是一个功能强大的聊天机器人,支持本地安装,无需互联网连接,集成了GraphRAG和聊天历史记录功能,能够快速、准确且可解释地从PDF、DOCX和TXT文档中检索信息。 DeepSeek RAG Chatbot 3.0 核心功能 本地化部署:无需网络连接,支持PDF/DOCX/TXT文档处理 混合检索架构:整合DeepSeek-7B、BM25、FAISS、Neural Reranking多模块 新增知识图谱构建:GraphRAG技术解析文档关联性 对话记忆功
AI
AIolmOCR PDF解析工具,支持ChatGPT 4与海量文档处理
olmOCR是一个用于处理复杂PDF文档的工具包,由艾伦人工智能研究所(AI2)开发。 olmOCR利用大型语言模型(例如ChatGPT 4)对PDF文档进行自然文本解析。olmOCR并非简单的OCR,而是整合了多种技术,包括:巧妙的提示策略以获得高质量的文本解析;用于比较不同处理流程版本的评估工具;基于语言和SEO垃圾内容的过滤功能;针对特定模型(如Qwen2-VL和Molmo-O)的微调代码;以及使用Sglang进行大规模PDF处理的流水线工具。 olmOCR支持本地和多节点(集群)运行,尤其适合处
AI
AIControl Plane For Your AI Agents (基于 mahilo 框架) :一个用于构建和管理多智能体系统的框架
Mahilo是腾讯开源的创新型多智能体协作框架,支持创建具备人机协同能力的智能体团队。Mahilo框架允许不同来源的智能体(包括其他框架创建的智能体)在统一平台中实现信息共享与协作,并始终保持人类监督者的控制权。 创建或注册多种智能体 可以基于框架自带的BaseAgent创建新的智能体,也可以集成其他框架(如LangGraph)中的智能体。 构建智能体团队 将这些智能体组合成一个团队,让他们可以相互交流、共享信息。 实现人机协作 (Human-in-the-Loop) 通过客户端连接到每个智能体,进行实
AI
AIAgent Leaderboard:评估AI在真实商业场景中利用工具的能力,使用TSQ指标衡量模型表现并提供排行榜
聚焦真实商业场景的Agent Leaderboard通过系统性评估,揭示大语言模型在复杂工具调用场景中的实战能力,最新排名可通过 https://huggingface.co/spaces/galileo-ai/agent-leaderboard 实时查看。 评估体系四重奏 1、模型筛选 覆盖12个闭源模型+5个开源模型,构建多元化评估矩阵 2、标准化配置 统一系统提示词 工具调用权限标准化 零温度设置确保评估一致性 3、数据精选策略 从四大标杆数据集中战略采样: BFCL(教育/学术场景) τ-ben
AI
AIWan2.1 开源视频生成模型,支持多种任务和分辨率
Wan2.1 是一套全面开放的视频生成模型,采用主流的扩散变换器(diffusion transformer)范式,支持多任务处理和高分辨率生成,同时兼容消费级GPU。 核心功能 1、SOTA性能在多个基准测试中超越现有开源模型和商业解决方案。 支持生成中英文视觉文本(如视频中的文字嵌入)。 2、低硬件门槛T2V-1.3B模型仅需8.19GB显存,可在RTX 4090上4分钟生成5秒480P视频(未优化)。 14B模型支持多GPU分布式推理(FSDP + xDiT USP技术)。 3、多任务支持文本生成
AI
AIClaude Code 终端智能编码助手
Claude Code 是一个终端编码工具,通过自然语言命令帮助开发者更快地执行常规任务和处理代码。 Claude Code集成在终端中,能够理解代码库,通过自然语言命令执行常规任务、解释复杂代码以及处理 Git 工作流。 Claude Code主要功能: 编辑文件和修复代码库中的错误 解答关于代码架构和逻辑的问题 执行和修复测试、代码检查及其他命令 通过自然语言指令执行编码任务 支持跨代码库的文件编辑和错误修复 解释复杂代码逻辑和架构 执行测试用例并修复相关问题 处理git工作流(合并冲突/提交/PR
AI
AIDeepSeek开源FlashMLA:针对Hopper GPU优化的高效MLA解码内核
高效性能:FlashMLA采用了一系列优化算法,可以显著提高模型的训练速度和推理效率。这使得研究人员和企业能够在更短的时间内获得更好的结果。 易于使用:项目提供了清晰的文档和示例,用户可以轻松上手,无需深入的技术背景就能使用其功能。 灵活性:FlashMLA支持多种深度学习框架,用户可以根据自己的需求自由选择使用的工具,使得它在不同的应用场景中更具适应性。 社区支持:作为一个开源项目,FlashMLA鼓励开发者参与其中,贡献代码和想法,从而不断推动项目的进步。 FlashMLA适用于多个领域,包括但不限
AI
AIDify:开源大语言模型(LLM)应用开发平台
Dify 是一个开源的大语言模型(LLM)应用开发平台,为开发者提供低代码 AI 应用开发服务,通过简化开发流程,Dify 帮助开发者快速构建和部署 AI 应用,降低技术门槛。 Dify 提供直观的可视化操作界面,开发者无需深入编写底层代码。通过简单的拖拽和配置操作,即可定义应用的提示词(Prompt)、上下文逻辑以及插件功能。 Dify 支持多种 AI 应用场景,包括: 智能客服与对话助手:利用自然语言处理技术,快速响应用户咨询,支持上下文记忆和多轮对话设计。 内容生成与文档处理:自动生成文章、摘要、
AI
AIWatermark-Removal 基于机器学习的图像修复
Watermark-Removal 基于机器学习的图像修复(Image Inpainting),通过深度学习技术自动去除图片中的水印,使修复后的图片与原图难以区分。 1、技术原理 基于生成对抗网络(GAN)和上下文注意力机制(Contextual Attention),通过图像修复技术填补水印区域的像素。 引用两篇论文方法: 《Generative Image Inpainting with Contextual Attention》(上下文注意力生成修复) 《Free-Form Image Inpai
AI
AI全网最全的白嫖 DeepSeek-R1 满血版的方法
2025 年初,DeepSeek-R1 凭借其强大的推理能力和开源精神席卷网络,被誉为"国产 AI 之光"。由于官方服务器不堪重负,加上 API 充值暂停,许多用户开始寻找替代方案。 下面介绍全网可用的免费无限访问 DeepSeek-R1 满血版的方法,涵盖特点、使用链接和详细步骤。 官方渠道蹲守 特点: 权威性:直接来自 DeepSeek 官方,体验最原汁原味 完全免费:无需付费,注册后即可使用 功能齐全:支持深度思考、长上下文对话等核心功能 不稳定:经常出现服务中断或排队 使用方法: 打开官网 ht
AI
AIMinima 开源的本地RAG容器,可与ChatGPT和Claude集成
Minima是一个开源的RAG(Retrieval-Augmented Generation,检索增强生成)本地部署容器,能够与ChatGPT和MCP(Model Configuration Protocol)集成,可以作为完全本地的RAG使用。 Minima目前支持三种模式 隔离安装:完全在本地运行,不依赖外部服务如ChatGPT或Claude,所有神经网络(LLM、重排序模型、嵌入模型)都在本地云或PC上运行,确保数据安全。 自定义GPT:使用ChatGPT应用或网页查询本地文档,索引器在本地云或P
AI
AIGitHub Copilot 代码补全功能现已支持 GPT-4o-mini 模型
GitHub Copilot 代码补全功能现已支持 GPT-4o-mini 模型。GPT-4o-mini 模型是基于 GPT-4o 模型的一个子集,专门针对代码补全任务进行了训练。GPT-4o-mini 模型在超过 275,000 个高质量公共代码库上进行了训练,支持超过 30 种流行编程语言,知识库更新成最新的了。 如果你是 Copilot Free 或 Copilot Pro 订阅用户,Copilot 代码补全的模型切换器会自动启用。如果你是 Copilot Business 订阅用户,则所属的组织
AI
AISkyReels SkyReels V1 开源人性化视频生成模型,支持文本与图像到视频的转换
SkyReels V1是一款以用户需求为核心的开源视频生成模型,支持文本到视频(Text-to-Video)和图像到视频(Image-to-Video)的转换。 SkyReels V1模型基于约1000万条高质量影视片段进行深度优化。 开源技术领先:在开源视频生成领域,SkyReels V1的文本到视频生成能力表现优异,部分性能甚至可与商业模型相媲美。 精准面部动画:模型支持33种面部表情和400多种自然动作组合,能够精准捕捉并呈现人类情感。 电影级视觉效果:生成的每一帧画面都具备专业电影制作水准,包括
AI
AI【DeepSeek本地部署指南】如何在自己的电脑上部署 DeepSeek-R1 模型,无限免费使用 DeepSeek
DeepSeek 是一款开源的大型语言模型,完全在本地机器上运行,无需互联网连接。本指南将详细介绍如何在 Mac 上安装 DeepSeek,从终端版本到用户友好的聊天应用程序。 为什么选择 DeepSeek? 与 ChatGPT 等云端 AI 模型不同,DeepSeek 在 Mac 本地运行,既经济实惠又能保护隐私。无论是研究、编程还是日常查询,DeepSeek 都提供了一种便捷的方式,让你无需依赖互联网即可随时使用 AI 模型。 第一步:下载和安装 Ollama 要运行 DeepSeek,首先需要安装