Workflow
NotebookLM
icon
搜索文档
腾讯研究院AI速递 20250731
腾讯研究院· 2025-07-31 00:03
生成 式 AI 一、 ChatGPT「学习模式」火爆上线,24小时的导师免费用 1. OpenAI上线ChatGPT新功能"学习模式",采用苏格拉底式逐步引导方式,帮助用户深入理 解复杂概念; 2. 所有免费版、Plus版、专业版和团队版用户均可免费使用,功能包括交互式提示、分步解 答和个性化支持; 3. 该模式背后的提示词被开发者Simon Willison发现并公开,系统会根据用户的教育背景和 知识基础调整教学策略。 https://mp.weixin.qq.com/s/_tdb7OORoHRQxQ-5jg7s5Q 二、 Grok即将推出了「Imagine」视频功能,挑战谷歌Veo 3 1. 马斯克的xAI即将为Grok iOS应用推出全新图像视频生成功能"Imagine",支持带音频的视 频生成,可一次性生成4段视频; 2. 数据集将3D高斯技术与自研空间大模型SpatialLM深度融合,打通"现实-虚拟-现实"闭 环,使其成为具身智能领域的"ImageNet"; 2. 实测效果逼真,细节丰富,支持多种风格生成,用户可通过语音或文字描述进行创作; 3. Imagine将拥有独立标签页,提供近乎实时的图像 ...
喝点VC|红杉美国重磅总结!对AI创始人的十大建议:专注于深入了解并解决实际用户问题,而不仅仅是展示技术实力
Z Potentials· 2025-07-14 14:22
定价策略 - 根据交付价值定价并货币化,超越基于席位或原始使用量的定价,将定价与AI实现的具体业务成果相结合,如工作流程完成度、可衡量的节省或战略影响 [2] - Amit Bendov/Gong强调价格应基于交付的价值而非席位 [3] - Manny Medina/Paid提出制定策略提高定价成熟度曲线,使定价与客户价值保持一致 [4] - Clay Bevor/Sierra和Bret Taylor/Sierra建议将定价模型与客户价值和购买流程相结合 [5] - Joe Spisak/Meta指出价值从模型开发转向应用和定制 [6] 基础设施与可靠性 - 任务关键型AI需要企业级基础架构,包括状态管理、可观察性、安全性和可扩展性,将可靠性视为一流的工程问题 [7] - Sridhar Ramaswamy/Snowflake强调可靠性和精确度对于企业AI应用和稳健工程至关重要 [8] - Ion Stoica/Databricks专注于解决实际生产问题而非演示或复合AI系统 [9] - Sahir Azam/MongoDB认为状态管理和多模式数据集成至关重要 [10] - Harrison Chase/LangChain提出构建持久性、可观察性和可扩展性的基础设施 [11] - Nikesh Arora/Palo Alto Networks指出安全性必须是内置的而非附加的 [12] - Clay Bevor/Sierra提到代理操作系统是管理复杂性的工具 [13] 工作流程集成 - 最有效的AI产品应无缝融入用户当前流程和环境,减少摩擦并推动采用,实现“零接触”或隐形自动化 [14] - Thomas Dohmke/GitHub指出Copilot的成功源于与开发人员的无缝结合 [15] - Eric Glyman/Ramp强调零接触自动化,系统应服务于用户而非相反 [16] - Arvind Jain/Glean认为背景至关重要,需与企业系统深度集成 [17] - Anish Agarwal和Raj Agrawal/Traversal提出架构需适应企业规模的复杂性 [18] 架构演进与可扩展性 - AI原生企业需每6-12个月重新评估和重构系统,构建灵活的模块化基础架构以快速集成新功能 [19] - Anish Agarwal和Raj Agrawal/Traversal强调架构需持续演进 [20] - Kevin Scott/Microsoft建议灵活构建应用程序以实现新进步 [22] - Amjad Masad/Replit提出利用AI功能发展系统并准备重新架构 [23] - Lin Qiao/Fireworks预计从训练转向推理 [25] 数据质量与透明度 - 高质量、治理良好的数据是可靠AI的基础,需投资于数据整理、集成和解释,将透明度和可解释性作为产品核心 [26] - Daniel Nadler/OpenEvidence强调准确性和质量以及来源引用的透明度 [27] - Nikesh Arora/Palo Alto Networks认为领域知识和数据是新的护城河 [28] - Hema Raghavan/Kumo提出将信任和透明度作为核心特征 [29] - Sahir Azam/MongoDB指出质量是新的前沿,需多模式数据集成 [30] 客户为中心的产品开发 - 专注于解决实际用户问题而非展示技术实力,直接与客户互动了解工作流程,提供以用户为中心的价值 [33] - Amit Bendov/Gong强调以客户为中心而非技术驱动 [34] - Eric Glyman/Ramp提出以效益为导向的产品开发 [35] - Clay Bevor/Sierra建议与客户体验团队密切合作 [36] - Arvind Jain/Glean和Sridhar Ramaswamy/Snowflake认为应从明确的用户价值开始 [36] 推理与代理能力 - 近期最大机遇是构建能推理、规划并自主执行复杂多步骤任务的系统,投资推理时间计算和代理编排 [38] - Bob McGrew/Ex-OpenAI指出推理代表最大机遇,更长时间思考使模型解决复杂问题 [38] - Hanson Wang和Alexander Embiricos/OpenAI/Codex提出基于委托的工作流程 [38] - Misha Laskin和Ioannis Antonoglou/ReflectionAI强调结合学习和搜索 [39] - Jim Fan/NVIDIA和Jim Gao/Phaidra认为通才和代理能力是差异化因素 [40] 专业化解决方案 - 成功的AI初创公司应专注于高摩擦、垂直领域问题,利用领域专业知识、数据背景和专业工作流程创造差异化 [42] - Winston Weinberg/Harvey强调构建深层领域专业知识 [42] - Anish Agarwal和Raj Agrawal/Traversal认为企业碎片化创造优势 [42] - Bob McGrew/Ex-OpenAI指出深度领域集成的企业应用程序不受前沿实验室竞争影响 [43] - Manny Medina/Paid建议做一只刺猬,最擅长解决特定问题 [44] 人机协作 - 最佳AI系统应增强人类优势而非取代人类,设计混合工作流程并确保强大的人机交互机制 [46] - Harrison Chase/LangChain和Anish Agarwal/Raj Agrawal/Traversal强调人机混合协作 [47] - Amit Bendov/Gong指出AI还不能被完全信任 [48] - Raiza Martin和Jason Spielman/Google/NotebookLM提出增强而非取代人类能力 [48] - Daniel Nadler/OpenEvidence强调通过透明度和控制建立信任 [49] 快速迭代与实验 - AI创始人需拥抱快速原型设计、持续用户反馈和创新文化,尽早发布实验版本以收集洞见 [53] - Josh Woodward/Google Labs和Thomas Iljic/Google Labs强调快速实验 [53] - Sebastian Siemiatkowski/Klarna提出快速从概念转向生产 [54] - Thomas Dohmke/GitHub和Matan Grinberg/Factory建议拥抱快速迭代 [55] - Anish Agarwal和Raj Agrawal/Traversal提出不断进行六个月的赌注并重新评估架构 [56]
不要拿AI造工具,要建设“新关系”
虎嗅· 2025-07-05 21:01
AI Native时代的产品新目标 - AI Native产品的核心是构建AI能力与用户之间的新型关系,而非单纯创造工具[7][13] - 系统提示词成为定义AI人设和交互关系的"源代码",如NotebookLM、Manus、Cursor等产品均通过首行提示词设定关系[10][11] - 大模型的"超语言能力"使其具备主体性,推动AI与人形成"互为主体"的高阶关系[12][13] 关系建设带来的挑战 - 情商成为产品价值交付的新维度,如Cursor通过提示词管理用户挫败感[17][19] - 生命感设计增强主体性,类宠物智能硬件通过传感器反应创造情绪价值[20][21] - 关系定义需前置写入产品源代码,忠于关系实现成为用户价值交付标准[15] 新关系催生的商业机遇 - 跨次元混合价值交付打破软硬件边界,如情绪管理硬件结合传感器与APP干预[29][30] - Fuzzi气囊支架通过硬件+软件突破品类价格天花板,实现功能与情绪价值叠加[32][35] - 服务分发逻辑从平台连接转向关系驱动,用户LTV天花板被突破[41][43] AI Native产品的新管线 - 产品工程聚焦Broad Input(宽输入)与Liquid Outputting(柔输出)[52][53] - Dia浏览器通过实时捕捉多标签页信息实现"一眼看千层"的主动感知[58][59] - 柔输出强调分步协作,如Devin主动澄清需求、Deep Research确认方案[65][66] 三维价值模型与组织变革 - 企业价值模型从二维用户覆盖转向三维AI能力高度[78][79] - 传统产品经济学与管理学失效,需重构收费模式与组织形态[85][88] - 创业者需同时服务用户与AI能力成长,构建数据飞轮驱动进化[75][76]
AI观察|“数字人”来了,主播们将何去何从?
环球网· 2025-06-30 14:46
直播带货行业趋势 - 618大促期间直播带货表现突出 吸引力超过平台折扣 [1] - 超级头部主播尝试转型或探索复出 行业格局发生变化 [1] - 罗永浩数字人直播4小时创造5000万GMV 效果超出预期 [1] 数字人技术应用 - 罗永浩数字人直播使用AI生成9.7万字剧本 驱动8300个动作 [1] - 数字人在声音克隆 唇形匹配 动作设计方面高度还原真人 [4] - 数字人具备良好互动效果 能根据评论区实时回复 [4] - 直播带货团队开始探索数字人"上岗"可行性 以降低真人主播风险 [4] AI在内容生成领域进展 - NotebookLM和豆包大模型推出AI播客功能 生成自然对话内容 [4] - AI对话自然程度超过刚入行电台主播 提升内容生产效率 [4] - AI可帮助行业降低选题 内容打磨 逐字稿撰写等工作量 [4] 行业运营模式变化 - 交个朋友公司运营60个矩阵号 采用7×24小时直播维持流量 [5] - 数字人技术有望帮助团队降低工作强度 优化运营效率 [5] AI技术局限性 - AI内容冲击主要影响缺乏干货和人格化表达的从业者 [5] - AI无法真正发起对话或进行现场追问 限制应用场景 [5] - 数字人难以复制真人主播的即兴发挥和独特个人风格 [5]
聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」
Founder Park· 2025-06-24 16:31
AI Native 产品的新目标 - AI Native 产品的核心是构建 AI 能力与人之间的新关系,而非单纯创造新工具 [13] - 系统提示词(System Prompt)成为定义 AI 与用户关系的关键,例如 NotebookLM、Manus、Cursor 等产品通过提示词设定人设和交互逻辑 [15] - AI 的「超语言能力」使其具备主体性,与人类形成「互为主体」的关系,这是高阶关系的核心 [18] 新关系带来的挑战 - 情商成为产品价值交付的一部分,例如 Cursor 通过系统提示词管理用户负反馈并提升交互体验 [21] - 生命感是增强 AI 产品主体性的关键,类宠物智能硬件通过传感器和简单反应创造情绪价值 [24] - 生命感的设计需多样化,涵盖顾问、朋友、宠物等关系类型,以低智能交付高情绪价值已被验证有效 [27] 新关系带来的机遇 - 跨次元混合价值交付:硬件与软件结合突破传统价值天花板,例如情绪管理可穿戴设备 [35] 和 Fuzzi 气囊支架 [36] - 新关系形成服务分发新通路,突破传统 ARPU 和 LTV 天花板,例如 Agent 产品按用量付费模式 [46] - 建设性关系需解放而非纵容人性,产品需避免隐藏议程以维持长期信任 [50][52] AI Native 产品的新管线 - 产品工程的核心是在不确定性中增强确定性,Broad Input(宽输入)和 Liquid Outputting(柔输出)是关键 [56][58] - 宽输入需多模态实时感知和高分辨率生活流捕捉,例如 Dia 浏览器通过主动获取标签页信息提升用户体验 [65][68] - 柔输出需分步交付并与用户协行,例如 Devin 追问需求、Deep Research 确认方案、YouWare 提供模板起点 [74][75] AI Native 的新价值模型 - 创业者需同时服务用户和 AI,通过产品工程释放 AI 能力 [82][84] - 价值模型从二维平面变为三维立体,AI 能力高度决定总体积 [85] - 传统产品经济学和管理学被颠覆,收费模式、组织形态等需重新思考 [95][97] 行业趋势与未来展望 - AI 推动生产力与生产关系的变革,3 年看生产力,10 年看生产关系 [95] - 极客公园通过社区支持技术创业者,探索新时代产品创新 [81] - 开放性问题如智能合约付费、价值创造新循环等预示行业未来方向 [95]
从案例分析到提示词写作,手把手教你制作最火爆的AI视频
歸藏的AI工具箱· 2025-06-18 14:57
AI视频制作趋势 - AI生成视频在社交媒体平台获得高互动量 包括国内外市场 即使内容看似简单但具有强吸引力 [1][2][3] - AI视频已渗透广告营销领域 案例显示某牙医诊所广告改用"大脚男孩"主题后播放量从数千跃升至56万次 [4] Veo3技术突破 - Veo3显著降低AI视频制作成本 仅需两次生成与简单合并即可完成作品 大幅简化流程 [6] - 模型支持从创意构思到提示词生成的全程自动化 人类仅需筛选点子与复制提示词 [6] - 技术突破跳过传统视频制作的图片生成 语音合成 唇形同步等复杂环节 减少90%工作量 [35] 爆款视频核心要素 - 反差感引擎:通过现代形式呈现古老/虚构内容 或让严肃角色展现生活化特质 制造喜剧效果 [11][14] - 伪纪实手法:模拟真实拍摄增强沉浸感 如采访/Vlog形式强化荒诞性 [12][14] - 共同认知基石:利用历史事件 流行文化IP或文化迷因降低观众理解成本 [13][14] - 情感共鸣点:将宏大叙事转化为普通人吐槽 如暴风兵抱怨"混蛋老板"引发打工人共情 [23] 创意生产方法论 - 使用NotebookLM交叉分析多个爆款视频 提取分镜结构 台词内容及爆火原因 [8][9][10] - 通过Gemini生成新创意 需包含8秒分镜的详细环境 角色 台词描述 优先选择现实题材 [17][18][21] - 提供两类标准化提示词模板:第一人称Vlog强调主观镜头 虚构采访侧重权威角色与金融黑话反差 [29][30][32][33] 视频生成流程优化 - 推荐使用Gemini Pro会员或FLOW工具 后者需切换至Veo3 Fast模型控制成本 [37][40] - 后期仅需基础剪辑拼接 可添加台标 滚动文字等元素增强伪纪实感 [44] - 支持1080P超分输出提升画质 未来视频类Agent有望进一步简化字幕等包装工作 [45][46] 行业影响 - Veo3推动AI视频制作门槛降低 每日新增爆款视频覆盖多品类 验证技术应用潜力 [44][46] - 每减少一个制作环节可拓展10倍创作者基数 技术普及将释放潜在内容生产力 [44][46]
对谈黄灯:普通二本学生的出路在哪里?
乱翻书· 2025-06-13 18:09
高考与学历价值重估 - 学历仅是敲门砖 个人能力与作品比学历标签更重要 需关注长板与差异化竞争[1] - 当前就业市场严峻 二本学生盲目卷考公考研性价比低 因第一学历限制竞争力提升空间有限[1] - 高校课程与社会需求脱节严重 教学内容滞后技术迭代 研究生毕业时知识可能已换代[1] 二本学生发展策略 - 务实策略是放弃唯学历论 转向提升解决问题能力 强化自驱自学能力[2] - 中小企业青睐"高性价比"人才 看重成本可控 技能即插即用 主动性强等特点[2] - AI工具改变技能习得逻辑 数据分析等技能通过AI辅助两三月可达可用水平[2] 技能培养与就业路径 - 课业达标即可 优先修炼新兴技能如无代码开发 新媒体运营等 技术红利降低学习门槛[3] - NotebookLM等工具成为新时代知识作弊器 远超传统学习方式效率[3] - 参与全国性专业比赛(如大学生方程式/机器人大赛)显著提升就业竞争力[77] 行业机会与职业选择 - 地方院校应立足本土与行业属性 如广东金融学院学生在当地财经机构就业率高[27] - 新兴产业(智能制造/直播电商/新能源汽车)创造大量就业机会 需结合地域优势产业[58][59] - 网络与新媒体专业因社会需求大 二本院校与重点大学起点接近 存在差异化机会[73] AI时代的教育变革 - AI替代基础岗位后 死记硬背知识考核必要性下降 应侧重理解能力与逻辑训练[39][40] - AI工具可抹平信息鸿沟 在志愿填报等场景提供决策支持 需提升使用熟练度[49][51] - 掌握AI工具+基础社交能力可胜任产品助理 运营专员等岗位 改变传统就业路径[2][76] 职业竞争力构建 - 作品价值远超学历 工作2-3年后用人单位更关注实际能力而非文凭[33][71] - 核心竞争力在于"一个长板" 无需全才 差异化优势比全面优秀更重要[35][36] - 非虚构写作等实践能力可形成迁移技能 直接满足用人单位需求[67][70] 城市与专业选择 - 填报志愿应将城市置于首位 大城市资源丰富度显著影响职业视野与发展机会[46][48] - 专业选择坚持兴趣导向 长期看喜欢专业的从业者最终成就高于功利选择者[47] - 文物修复等细分领域存在人才缺口 地方院校专业设置灵活可快速响应需求[59] 新媒体时代的机遇 - 短视频等媒介为普通人提供表达渠道 三农/舞蹈等领域博主获得传统难以想象的机遇[9][10] - 在社交媒体积极发声可建立连接 优质内容互动能创造意外职业机会[62][64] - "加足够多定语"的细分赛道策略 通过垂直领域差异化获得竞争优势[37]
对谈黄灯:普通二本学生的出路在哪里?
乱翻书· 2025-06-13 18:04
教育与社会需求脱节 - 高校课程与社会需求严重脱节,教学内容滞后于技术迭代,脱离产业真实场景 [1] - 过度聚焦应试导致实践能力空心化,对真实社会需求认知模糊,缺失动手意愿与实操能力 [1] - 学历通胀背景下,二本学生若盲目卷考公考研,竞争力提升空间有限且性价比低 [1][12] 二本学生核心策略 - 尽早放弃"唯学历论",转向提升动手解决问题能力,强化自驱自学能力 [2] - 中小企业更青睐"高性价比"人才,因成本可控、技能即插即用、主动性强 [2] - AI工具大幅降低技能习得门槛,如数据分析、基础开发等技能可通过AI辅助快速掌握 [2][3] 就业市场新机遇 - 新兴技能如无代码开发、新媒体运营、AI视频剪辑等学习门槛降低,B站等平台提供海量免费资源 [3] - 地方院校学生应立足本土流动,结合学校行业属性(如财经类院校对接当地银行、保险机构) [27] - 新兴产业如智能制造、直播电商、新能源汽车等吸纳年轻人,需观测城市优势产业与自身所长结合 [58][59] 个人差异化竞争 - 社会并非优胜劣汰而是异胜同汰,需聚焦自身长板与差异化 [23] - 作品价值远高于学历,如非虚构写作、GitHub项目等能突破学历限制 [32][33] - 年轻人只需一个长板即可立足社会,如独特技能或实战经验 [35][36] 填报志愿与城市选择 - 填报志愿应将城市排在第一位,大城市资源丰富且影响社会感知 [46][48] - 专业选择需坚持兴趣或观察社会需求,避免被父母左右导致后续改行 [47] - AI可辅助志愿填报决策,抹平信息鸿沟,如模拟院校/专业前景 [49][51] AI时代的能力重塑 - 死记硬背的知识考核必要性下降,但需保留基础信息素养以理解AI输出 [39][40] - AI工具实现信息平权,主观能动性与自学能力成为核心竞争力 [75][76] - 参与全国性专业比赛(如机器人大赛)可快速提升实践能力并被用人单位关注 [77] 社会化与职业观培养 - 大学生需走出校园增强社会化程度,通过实习/兼职培养务实做事能力 [61][66] - 用人单位更看重解决问题能力,非虚构写作等实战作品能显著提升就业优势 [67][70] - 媒体、新媒体等领域对学历包容性较高,二本学生可关注灵活回应社会需求的专业 [73][74]
全世界第一个AI超级应用诞生|AI产品榜
36氪· 2025-06-09 21:59
核心观点 - ChatGPT在双端(应用和网站)超越海外社交媒体X(原Twitter),成为全球首个AI超级应用,月活用户达6.2亿(APP端)和月访问量56亿(Web端)[3][7] - AI产品榜发布18个子榜单,覆盖全球及国内AI产品表现,包括搜索引擎、聊天机器人、视频生成等细分领域[5][6] - 全球AI竞争格局呈现大厂垄断趋势,但新兴产品如Wanderboat(旅游向导)和扣子空间(协作工具)增速显著[8] 全球总榜 - ChatGPT以56.8亿月访问量位居全球第一,增速6.82%[9] - New Bing和Gemini分列第二、第三,访问量分别为14.6亿和5.44亿,Gemini增速达28.9%[9] - DeepSeek和纳米AI搜索是唯一进入全球前十的中国产品,分别排名第四和第六[8][9] 国内总榜 - DeepSeek以4.317亿月访问量领跑国内榜单,但增速下降7.87%[11] - 纳米AI搜索、豆包(抖音)、Qwen.ai(阿里)分列第二至第四,访问量均超4500万[11] - 大厂产品垄断前十,仅DeepSeek和纳米AI搜索表现突出[8] 增速/降速榜 - 全球增速前三:Sora(ChatGPT视频工具)增长121.25%,NotebookLM(Google知识库工具)增长34.27%,HeyGen(视频生成)增长33.21%[10][20] - 国内增速前三:Wanderboat(旅游向导)增长130.35%,knowt(学习卡片)增长58.07%,扣子空间增长51.43%[8][20] - 全球降速显著产品:Sora.com(OpenAI)下降68.79%,InsMInd(图片编辑)下降63.22%[21] 细分领域表现 - **搜索引擎**:New Bing以14.6亿访问量领先,Perplexity AI增速12.14%[22] - **聊天机器人**:Character AI(虚拟角色生成)以2.146亿访问量居首,SpicyChat AI增速15.34%[23][24] - **PPT工具**:Gamma(访问量2649万)和AiPPT.cn(像素绽放,增速36.19%)表现突出[25] - **视频生成**:Sora(ChatGPT)增速121.25%,HeyGen增速33.21%[28][30] - **代码助理**:GitHub Copilot以2.9289亿访问量领先,Cursor增速13.3%[33] 新兴产品亮点 - 旅游向导Wanderboat月访问量246万,增速130%[8] - 设计智能体Lovart和智能体浏览器fellou作为5月新产品,访问量分别达60万和127万[8] - Google NotebookLM(知识库工具)访问量6634万,增速34.27%[8]
1个月憋出产品,谷歌系新创AI公司,已获投资
搜狐财经· 2025-06-06 20:18
公司概况 - 前谷歌NotebookLM核心团队成员Raiza Martin、Jason Spielman和Stephen Hughes于2024年12月离职创立Huxe [2][6] - 公司首款产品为消费级AI语音助手 可连接邮箱 日历等个人数据流生成定制音频简报 [2][6] - 产品初版开发仅耗时1个月 远快于大厂流程 [3][6] - 旧金山风投Conviction合伙人Pranav Reddy确认参投 但未披露具体融资金额 [2] 产品与技术 - 核心功能DeepCast支持实时问答 用户可随时打断或追问 [6] - 产品通过AI音频内容流减少用户屏幕时间 提升现实世界参与度 [6] - 最初定位企业级应用 后转型消费者业务 保留跨工具集成核心理念 [6] 行业竞争 - 直接竞品包括谷歌Gemini(连接Gmail等应用)和OpenAI(支持Google Drive集成) [7] - NotebookLM仍持续迭代 新增公开分享笔记功能 [7] - 创始人认为AI领域需快速迭代 "瞻前顾后难以保持创造力" [7] 团队背景 - 团队开发NotebookLM期间发现音频学习需求旺盛 促使创业 [3][6] - 设计师Spielman称谷歌效率低下是误解 但承认其官僚主义问题 [6] - 团队具备大厂技术积累 选择独立开发以加速概念验证 [6] 市场定位 - 瞄准音频信息消化场景 认为"人们更易接受音频形式信息" [6] - 试图在科技巨头主导的AI语音助手赛道开辟细分领域 [8] - 商业模式未明确 目前聚焦产品功能验证 [2][6]