AI

AI
AIDeepSeek-RAG-Chatbot 本地部署的高效文档检索与智能问答工具
DeepSeek-RAG-Chatbot是一个开源项目,通过本地部署方式提供高效、准确且私密的文档检索与智能问答服务。DeepSeek-RAG-Chatbot结合了多种先进技术,在文档检索和自然语言处理领域有非常高的性能表现。 1、文档上传与处理 用户可上传多种格式的文档(如PDF、DOCX、TXT等),系统会自动拆分文档并生成向量嵌入,便于后续检索与处理。 2、混合检索机制 结合BM25(基于关键词的检索)和FAISS(基于向量的语义检索)技术,能从文档中快速、准确地找到相关内容。 3、知识图谱支持(
AI
AI
AIComposio:为AI代理和大型语言模型(LLMs)提供高质量集成的工具集
Composio是一个为AI代理和大型语言模型(LLMs)提供高质量集成的工具集,通过函数调用,Composio支持超过100种集成,帮助开发者更高效地构建和部署AI应用。 Composio的核心功能 Composio提供了一系列生产就绪的工具,包括: • 支持250多种工具,涵盖多个类别:如GitHub、Notion、Linear、Gmail、Slack、Hubspot、Salesforce等软件工具。 • 操作系统操作工具:包括文件工具、Shell工具、代码分析工具等。 • 搜索功能:支持Googl
AI
AIDeepSeek + 飞书多维表格:批量生成文案
飞书多维表格擅长批量生成内容,能够显著提升工作效率。 无论是文案、视频脚本还是热门文章,都可以通过飞书多维表格快速生成。 飞书结合DeepSeek快速生成多维表格具体操作步骤如下: 1,新建一个多维表格,添加一个字段,命名为【xx主题】。 2,继续添加另一个字段,命名为【DeepSeek 指令】,并设置相关参数,对象选择【DeepSeek R1】。 3,在配置中,选择第一个创建的字段,同时勾选R1的思考和输出结果选项。完成后,表格中会自动生成两个新字段。 4,如果需要更精准的主题内容,可以在【自定义请求
AI
AI阿里巴巴通义实验室AI人像视频生成技术 EMO2
EMO是由阿里巴巴通义实验室开发的音频驱动高表现力人像AI视频生成技术,最新升级版EMO2通过一张人物肖像图片和任意长度的音频,能够驱动人物进行说话、唱歌或手势舞,生成的表情和动作具有高度的感染力和专业水准。 在AI技术领域,通过音频驱动人物面部表情已实现,但在虚拟主播和数字人交互等新兴领域,如何通过音频自动生成自然流畅的动作和表情仍是技术焦点,以往的方法在手部动作生成上存在肢体错乱或动作幅度不足的问题,主要因为人类身体作为多关节复杂系统,难以实现复杂动作的驱动。 EMO2受机器人控制系统启发,将手视为
AI
AIAI越来越强大,用多了人会变蠢吗?
微软研究院与剑桥大学合作,研究了AI对批判性思维的影响,发现过度依赖生成式工具会减少人们使用自己的批判性思维。 研究聚焦于生成式AI和知识工作者,即经常使用大模型工具进行案头工作的人群,共有319名知识工作者参与,他们每周至少使用一次AI工具,如ChatGPT、微软的Copilot和Google的Gemini,总用例达到936个。 当前的GenAI工具特别擅长处理文书类任务,研究人员将这些任务分为三大类和九小类,基本覆盖了大多数场景,如润色邮件、总结内容、提取要点和精准查询等。 使用AI的目的是提高效率
AI
AI首个基于百川大模型打造的 AI 儿科医生:北儿AI儿科医生
2 月 13 日,国家儿童医学中心首都医科大学附属北京儿童医院成功举办了国内首次「AI 儿科医生 + 多学科专家」双医并行多学科会诊。这一创新模式标志着人工智能技术在儿科医疗领域的深度应用迈出了重要一步。 此次会诊汇聚了来自耳鼻咽喉头颈外科、肿瘤外科、肿瘤内科、神经外科等科室的 13 位知名专家,包括倪鑫院长。同时,会诊中还引入了一位特殊成员 —— 由北京儿童医院与百川智能、小儿方健康科技联合研发的「AI 儿科医生」。该 AI 系统基于百川智能的 Baichuan M1 大模型,于 1 月 18 日正式
AI
AI
AICherry Studio:支持多模型服务的Windows和macOS GPT客户端
Cherry Studio是一款支持多模型服务的Windows和macOS GPT客户端,Cherry Studio集成了多种大型语言模型云服务,包括OpenAI、Gemini、Anthropic等,并支持Claude、Peplexity、Poe等AI网络服务,它还支持本地模型,通过Ollama实现。 Cherry Studio提供了300多个预配置的AI助手,用户还可以创建自定义助手,并支持多模型同时对话。在文档与数据处理方面,它支持文本、图像、办公文件、PDF等格式,具备WebDAV文件管理与备份、
AI
AIDeepSeek-R1 大规模强化学习推理模型
DeepSeek-R1是一款基于大规模强化学习的推理模型,在数学、代码和推理任务上表现优异。 DeepSeek-R1模型概述 DeepSeek-R1 是由深度求索公司开发的第一代推理模型系列,包括 DeepSeek-R1-Zero 和 DeepSeek-R1 两个主要模型。 DeepSeek-R1-Zero模型是通过大规模强化学习(RL)训练,无需预先进行监督微调(SFT),展现出强大的推理能力,并自然涌现出多种推理行为,例如自我验证、反思和生成长链推理(CoT)。这是第一个公开的研究,验证了大型语言模
AI
AIHugging Face 开源深度学习资源库
Hugging Face 不是一个深度学习框架,它提供了最重要的开源深度学习资源库。 Transformers 提供了数以千计的预训练模型,支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成,让最先进的 NLP 技术人人易用。 Transformers 的API让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。每个定义的 Python 模块均完全独立,方便修改和快速研究实验。 Transformers 支持三个最热门的深度学习库:Jax,
AI
AIAutoMouser 自动化测试浏览器扩展
AutoMouser是一个Chrome 扩展程序,能够智能地跟踪用户的交互操作,利用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码,简化了创建自动化测试的过程。 AutoMouser能够实时追踪用户的交互操作,包括点击、输入和滚动等,能够智能地整合输入操作并检测窗口大小变化,输出的代码结构清晰,易于维护。 安装后,在 Chrome 工具栏点击 AutoMouser 图标开始录制操作,完成录制后再次点击图标即可生成代码,生成的代码包括交互数据的 JSON 文件和生成的 Seleniu
AI
AIPDF to Podcast将PDF转换为音频
PDF to Podcast 是一个由 NVIDIA 提供的 AI 蓝图,能帮助开发者构建可以将 PDF 文档转换为生动音频内容。 PDF to Podcast基于 NVIDIA NIM 微服务架构,能够在私有网络中安全运行,能在不共享敏感数据的情况进行转换。 用户上传目标 PDF 文档,系统会生成音频内容,可以选择性地添加上下文 PDF 文档作为参考。 PDF to Podcast地址:https://github.com/NVIDIA-AI-Blueprints/pdf-to-podcast
AI
AIVLC 使用本地 AI 为视频生成实时字幕,并翻译为 100 多种语言
VLC是知名的跨平台开源视频播放器,全球下载量超60亿次。在CES 2025上,VLC展示了新版本,具备AI字幕和翻译功能,可在本地电脑离线实时生成。 VLC播放器最早可追溯至1996年,历史悠久且深受欢迎,起初叫VideoLAN Client,主要用于校园网络视频传输,2001年,VLC开源发布,逐渐发展成强大的跨平台多媒体播放器。 VLC的Logo是一个橙色交通锥,最早的开发者是一群巴黎中央理工学院学生,收集了这个交通锥。 VLC发布的视频中,使用开源AI模型,能根据视频自动生成字幕,能自动翻译成多
AI
AIVITA-1.5 开源交互式多模态大语言模型
VITA-1.5是一款强大的开源交互式多模态大语言模型,支持实时视觉与语音交互。 VITA-1.5 接近GPT-4o级别的性能,与之前的版本VITA-1.0相比,VITA-1.5在多个方面进行了改进,主要包括: 1,交互延迟显著降低:语音交互的端到端延迟从约4秒减少到1.5秒,提升用户体验。 2,多模态性能增强:在多个基准测试(如MME、MMBench和MathVista)上的平均性能从59.8提高到70.8。 3,语音处理能力改善:ASR(自动语音识别)错误率从18.4降至7.5,同时替换了独立的TT
AI
AIAI手术机器人能操纵针头和缝合伤口,缝合手术比医生快30%
美国约翰霍普金斯大学与斯坦福大学的研究人员开发了一款AI手术机器人,能够执行外科手术中的三项基本操作:操纵针头、提起身体组织和缝合。在缝合等标准手术任务中,机器人手术时长比人类医生缩短约30%,不仅能完成小手术,还能独立完成一台完整的手术。 在研究过程中,研究人员训练机械臂,让它“观看”超过10000条手术视频,这些视频来自真实手术室,由医生手腕上的摄像头录制。通过学习,结合模仿学习(IL)方法,机器人能够观察和模仿真人医生的行为,达到与人类医生相当的水平。 研究中使用的“硬件利器”是达芬奇手术系统(d
AI
AIAI YouTube Shorts Generator长视频剪辑工具
AI YouTube Shorts Generator能自动剪辑长视频精华,一键生成短视频利器。 支持自动分析长视频,提取最有趣的部分,支持视频裁剪和合成,生成短视频。 AI YouTube Shorts Generator开源,用户可自定义和扩展功能,适用于内容创作者和视频编辑者,通过自动提取和合成视频,快速制作短视频。
AI
AI阿里发布 Qwen-Agent 框架
阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent,基于现有 Qwen 语言模型,支持智能体执行复杂任务,提供多种高级功能。 Qwen-Agent 是一个开发框架,开发者可基于Qwen-Agent开发 Agent 应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力,提供浏览器助手、代码解释器、自定义助手等示例应用。 Qwen-Agent 采用两层架构,底层提供语言模型和基础工具,顶层提供现成的智能体组件。开发者可以灵活组合这些组件,构建能够执行复杂任务的智能体
AI
AIDeepSeek 幻方量化创始人梁文锋访谈集锦
(1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现。 (2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。 (3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。 (4)我们不
AI
AI揭秘DeepSeek:一个更极致的中国技术理想主义故事
中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 De
AI
AI疯狂的幻方:一家隐形AI巨头的大模型之路
在蜂拥而至的大模型团战中,幻方大概是最异类的一个。 这是一场注定是少数人的游戏,很多创业公司在大厂入局后开始调整方向甚至萌生退意,而这家量化基金却孤绝前行。 5月,幻方把下场做大模型的独立新组织,命名为“深度求索”,并强调将专注于做真正人类级别的人工智能。他们的目标,不只是复刻ChatGPT,还要去研究和揭秘通用人工智能(AGI)的更多未知之谜。 不仅如此,在这个被认为格外依赖稀缺人才的赛道,幻方还试图去集结一批有执念的人,并祭出了他们认为的最大武器:一群人的好奇心。 在量化领域,幻方是一家抵达过千亿规
AI
AI吴恩达联手OpenAI推出一门o1免费新课程
OpenAI 联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用 o1 进行推理的免费 DeepLearning.AI 课程 ——Reasoning with o1,讲师是 OpenAI 战略解决方案架构主管 Colin Jarvis。 课程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1 Reasoning with o1课程内容主要 1,o1 即时工程的基础知识 2,规划和执行多步骤任务 3,创建和编辑代码 4,图