AI

AI
AIGPT-4.1 Prompting 提示词官方指南
GPT-4.1 Prompting 提示词官方指南汇集了 OpenAI 内部大量测试后总结的 prompt 技巧,目的是帮助开发者充分利用 GPT-4.1 模型家族的强大功能,特别是在编码、指令遵循和处理长上下文方面。 指令的迁移和精确性: GPT-4.1 更严格地遵循指令,需要更明确和精确的 prompt。以往的模型可能会更自由地推断意图,但 GPT-4.1 需要更直接的指示。 如果模型行为不符合预期,只需用一句话明确说明所需行为,通常就能纠正。 Agentic 工作流: 持久性 (Persisten
AI
AI
AIMidscene.js 让 AI 帮你操作网页、验证内容,提取数据
Midscene.js 让 AI 成为你的浏览器操作员,你可以通过自然语言描述来操作网页、验证内容和提取数据,Midscene.js能简化自动化过程。 自然语言交互 你只需描述你的目标和步骤,Midscene.js 就会为你规划和操作用户界面,你不需要编写代码就能实现工作自动化。 Chrome扩展 你可以通过Chrome扩展立即体验Midscene.js,不需要编写代码。 Puppeteer/Playwright集成 Midscene.js 支持与Puppeteer和Playwright集成,你可以结合
AI
AIBrowseComp AI 基准测试
BrowseComp 是一项基准测试,用于衡量 AI 代理在寻找难以获取信息方面的表现。 BrowseComp 基准测试涵盖了 1266 个复杂的问题,每个问题的答案都简短,每个问题理论上只有一个正确答案。设计这些问题时,考虑到了它们的难以从网上找到但易于核实的特性,为了保证挑战性,在创建问题时会检验现有模型是否能解决,答案是否不在搜索引擎首页,人类是否难以在短时间内找到。 BrowseComp 测试针对 AI 代理执行有益浏览操作的能力展开评估,涵盖互联网内容事实推理、浏览的持久性与深度,以及搜索时的
AI
AIGitHub Copilot新手操作手册
GitHub Copilot 是什么? GitHub Copilot 是一款由 AI 驱动的编程助手,能通过分析上下文实时生成代码建议。 GitHub Copilot基于生成式 AI 技术,通过学习海量代码库理解编程逻辑,为开发者提供动态解决方案,使用前需注册 GitHub 账户并获取 Copilot 许可证,安装编辑器插件并完成认证后即可使用。 GitHub Copilot 核心功能详解 1、代码补全 场景示例:用 Python 编写「石头剪刀布」游戏。 新建 rock_paper_scissor.p
AI
AI使用AI工具联网搜索时的prompt小技巧汇总
借助AI工具问答问题能够帮助我们提升效率、弥补知识短板。 我们对AI工具“深度联网搜索”模式的依赖日益加深,有时会忘了搜索引擎的存在。 在利用这些功能时,AI通常借助一个思考机制,对用户的问题进行改写或转换,然后分别使用搜索引擎进行检索,最后把收集到的文档汇总并输出结果。一些互联网搜索(如Google Search)的常用技巧,在和AI工具交互时也可以使用。 在通过prompt问答时结合这些技巧,能让AI给出的答案更符合我们的需求。 一、指定网站的检索:site语法 site语法可以帮助我们在检索时,让
AI
AIEasyControl_Ghibli 轻松创作吉卜力风格图像
EasyControl_Ghibli是一款生成吉卜力风格图像的AI模型,已登上Hugging Face平台,用户能在网页直接使用,非会员也能使用,没有隐藏条件,不用下载,无需编程知识,真正做到轻松创作。 EasyControl_Ghibli特点 免费:能够免费生成吉卜力风格的图像。 操作简便:打破传统AI图像生成的限制,不需要你有丰富的背景知识,使用复杂的提示词,普通用户非常容易就能进行艺术创作,打开网页就能用。 吉卜力风格:虽为替代方案,但生成的吉卜力风格图像不比GPT - 4o差,能抓住吉卜力作品标
AI
AI
AIAI 编程神器 Cursor 使用技巧
首先我们需要了解 Cursor 为我们在不同的场景提供了不同能力支持,从简单场景到复杂场景一次是:Tab、Inline chat、Ask 以及 Agent。(Ask 对应老版本的 Chat;Agent 对应老版本的 Composer) Cursor 十大使用小技巧 技巧一:终端对话 你再也不用因为忘记了 linux 命令而苦恼,直接 command+k ,使用自然语言去描述命令行(你可以在本地开一个 Cursor 的项目专门操作本地终端)。 技巧二:历史代码生成注释 使用 command+k,为历史代码
AI
AI阿里巴巴Qwen2.5-Omni全模态大模型
Qwen2.5-Omni作为阿里巴巴通义千问团队最新发布的多模态模型,实现了端到端的全模态处理能力,支持文本、图像、音频和视频四种数据类型的输入与输出,采用实时流式处理架构。 多模态交互能力 • 支持视频与音频输入的时间同步处理 • 实现文本与语音的实时双向转换 • 处理过程中保持跨模态信息的一致性 技术架构创新 • 采用TMRoPE位置嵌入技术 • 优化多模态数据的时间对齐 • 提升流式处理的响应速度 性能表现 多模态基准测试 • OmniBench测评成绩超越Gemini-1.5-Pro • MVB
AI
AIDeepSeek V3-0324代码生成模型:6850亿参数超Claude 3.7,API价格成本低至1/27
代码生成性能突破 DeepSeek-V3-0324版本近期完成技术迭代,参数规模扩展至6850亿,混合专家架构(MoE)优化显著提升代码生成质量。实测数据显示,DeepSeek-V3-0324版本模型在HTML5+CSS前端开发任务中表现非常优秀,单次生成代码量可达958行,完整实现响应式网页设计与交互功能,在对比测试中,DeepSeek-V3-0324生成的代码效果接近Claude 3.7 Sonnet,部分场景如PDF转可视化网页反超竞品。 多维度技术测试 跨格式转换:支持从文字描述生成带3D动画的
AI
AI微软面向初学者的生成式人工智能教程
微软推出的“生成式AI入门”课程,包含21节课,帮助你掌握构建生成式AI应用的基础知识。每节课都围绕一个特定主题展开,分为“学习”和“构建”两类,“学习”课程主要讲解生成式AI的概念,“构建”课程结合概念和代码示例,使用Python和TypeScript进行演示,每节课还附有“继续学习”部分,提供额外的学习资源。 课程内容 1、课程设置:帮助你配置开发环境。 2、生成式AI简介:了解生成式AI的基本概念。 3、探索和比较不同的LLM:学习如何选择和比较不同的语言模型。 4、负责任地使用生成式AI:探讨生
AI
AI大模型应用开发入门指南:从零构建个人知识库
大模型应用开发入门指南为开发者提供一套完整的大模型应用开发入门教程,围绕个人知识库助手的构建展开,教程覆盖从大模型基础理论到实际应用开发的完整链路,适合具备基础Python能力的开发者学习。 1、知识库构建:支持文档加载、向量化存储及检索。 2、多模型调用:封装国内外主流大模型API(如百度文心、讯飞星火、智谱GLM),提供统一调用接口。 3、交互与展示:集成流式回复、历史对话记录,并通过Gradio或FastAPI快速搭建演示界面。 技术架构 1、核心框架 LangChain:用于整合大模型、向量数据
AI
AILanguageTool 多语言智能AI写作辅助大师
LanguageTool是基于规则引擎与机器学习融合的智能AI写作辅助工具,覆盖30种语言(含中文、英语、德语等),采用C/S架构,支持浏览器插件(Chrome/Edge)、Office套件(Word/PPT)、Google Docs扩展及独立客户端四种部署模式,核心算法通过ISO 27001认证,用户数据采用AES-256加密传输,误报率较传统工具降低40%。 LanguageTool功能 1、语法校验 基础错误检测:识别拼写错误、标点误用(如中文逗号与英文逗号混淆)、主谓不一致等常见问题 语义级纠错
AI
AI零代码构建Web应用:v0与Cursor AI全流程实战手册
v0(Vercel开发)与Cursor AI的组合为Web应用开发提供新范式,前者专注前端界面生成,后者处理代码整合与功能扩展,让非技术用户能在数分钟内完成从概念到可部署产品的转化,为专业开发者节省70%以上的基础编码时间。 环境配置与基础操作 1、v0前端生成器配置 1、注册与登录 访问v0官方控制台 选择GitHub账号授权登录(建议关联仓库以便后续部署) 首次使用需同意数据使用条款 2、界面参数设定 主题模式:深色/浅色切换(右上角用户菜单) 输出语言:默认React/Tailwind CSS,支
AI
AI掌握大模型提示词技巧的23个实用方法
随着AI技术的进步,大型语言模型越来越能理解人类的自然语言,用户在使用这些模型时,得到的回答质量因为提问的不同得到的答案大相径庭。掌握有效的提示词技巧,能够显著提升我们与AI的交互效果。 以下是23个实用的提示词技巧,能帮助你更好地与大型语言模型沟通,得到你想要的结果。 一、精简指令,提高效率 1、省略礼貌用语 与大型语言模型交流时,直接陈述需求或问题更为高效。例如,询问天气时,直接说“明天杭州的天气如何?”而不是“请告诉我,如果你不介意,明天杭州的天气如何?谢谢。” 2、使用肯定指令 明确告诉模型你希
AI
AI机器学习100天
第1天:数据预处理 开始机器学习的第一步是数据预处理。了解如何处理缺失数据、编码分类变量、特征缩放以及数据集的划分。 第2天:简单线性回归 学习简单线性回归的基本概念,如何通过最小二乘法拟合数据,并理解回归系数的含义。 第3天:多元线性回归 扩展线性回归到多个自变量,理解多元线性回归的模型构建和参数估计。 第4天:逻辑回归 初步接触逻辑回归,了解其用于分类问题的基本原理。 第5天:逻辑回归的数学基础 深入研究逻辑回归的数学原理,包括代价函数的计算和梯度下降法的应用。 第6天:逻辑回归实践 通过实际案例进
AI
AIAnus 开源AI代理框架
ANUS(Autonomous Networked Utility System)是一个强大灵活的开源AI代理框架,结合了现代AI技术和最佳实践,提供强大的多代理协作和灵活的模型集成。 ANUS允许用户创建能够执行复杂任务的AI代理,这些任务包括通过自然语言指令执行操作、在多代理环境中协作解决问题、与Web服务、文档和代码交互,处理包括文本、图像和音频在内的多模态输入。ANUS适用于不同领域和用例,适合开发者、研究人员和AI技术爱好者使用。 开源:完全开源,无任何限制。 混合架构:结合单代理的简单性和多
AI
AIautoMate:AI驱动的本地自动化工具
AutoMate 是一个基于AI的人工智能+RPA(机器人流程自动化)自动化工具,让你的电脑帮你完成重复性的工作,解放你的时间和创造力。 自然语言自动化:用户只需用自然语言描述任务,无需编程知识即可实现自动化。 全界面控制:支持对任何可视界面的操作,不受限于特定软件。 本地部署:数据安全有保障。 多模型支持:兼容主流的大型语言模型。 持续学习:随着使用,不断学习和适应你的工作习惯。 与传统 RPA 工具复杂的规则设置不同,autoMate 借助大型语言模型,仅需自然语言任务描述即可完成复杂自动化流程,让
AI
AI厦门大学计算机系林子雨团队DeepSeek大模型系列报告
2025年春节期间,DeepSeek的发布在全球范围内引起了巨大反响,标志着人工智能大模型正式进入“普惠”时代,大模型正在深刻改变我们的工作和生活方式,学习和掌握大模型技术已成为每个人的必要任务。 你是否想深入了解大模型的核心内容?厦大团队精心准备了四份大模型科普报告,面向社会大众的140页PPT报告,详细讲解了大模型的基本概念、技术原理及其实际应用,帮助普通人轻松理解大模型。对于高校师生,120页PPT报告深入分析了DeepSeek大模型如何推动教学与科研的创新,为学术研究提供新的动力。针对企业用户,
AI
AILocal-NotebookLM将PDF转换为博客的AI工具,支持多种LLM与TTS模型
Local-NotebookLM是一款本地AI工具,能够将PDF文档转换为播客,它利用本地大型语言模型(LLM)和文本转语音(TTS)技术,无需依赖云服务,直接在本地运行。 PDF处理 从PDF中提取文本,进行清洗与格式化,确保内容准确无误。 播客生成 支持生成多种风格的播客,包括休闲、正式、技术和学术类型,用户可根据需求选择不同长度(短、中、长、很长)和格式(播客、文章、总结、采访)。 LLM支持 兼容多种LLM提供商,如OpenAI、Groq、LMStudio、Ollama、Azure等,用户可选择
AI
AINanobrowser 开源AI网页自动化工具
Nanobrowser是一款开源AI网络自动化工具,可在浏览器中运行,作为Chrome浏览器扩展,Nanobrowser提供强大的网页自动化功能,用户无需支付订阅费用,仅需承担API密钥的使用成本。与OpenAI Operator等付费服务不同,Nanobrowser允许用户完全掌控自己的数据和API密钥,所有操作均在本地浏览器中进行,确保隐私安全。 Nanobrowser特点 1、完全免费 无需订阅费用,用户只需支付API密钥的使用成本。 2、隐私保护 所有操作在本地浏览器运行,数据和凭证不会上传至云