Workflow
大语言模型
icon
搜索文档
重新理解Agent的边界与潜力|AI转型访谈录
腾讯研究院· 2025-05-29 17:28
Agent市场现状与定义 - 2025年被称为"Agent元年",各类Agent产品快速涌现,但市场尚未形成统一定义[1] - 主流观点将Agent视为传统工具升级版,但其变革潜力可能远超预期[1] - AI Native公司正突破"效率工具"框架,探索Agent在商业洞察、创意生成等领域的深层价值[1] Atypica.ai产品创新 - 采用大语言模型模拟真实用户行为,构建用户画像并驱动决策流程[3][5] - 首创发散优先模型,适合处理商业问题的非共识和艺术性部分[3][26] - 通过多智能体交互揭示人类决策盲区,形成创新研究方法[3][63] - 工作流程包括问题定义、任务分解、社交媒体搜索(Persona生成(5-100个)和访谈总结[18][19] 商业应用场景 - 解决四大类商业问题:市场洞察(如发现MPV需求)、产品共创、产品测试和内容规划[20] - 典型案例包括新能源汽车市场分析、巧克力配方测试和小红书账号定位[20] - 实现跨国调研效率提升(如法语提问直接生成中国社交媒体分析报告)[21] - 正在整合权威媒体数据源,增强定量分析能力[23] 技术实现路径 - 基于Deepseek v3构建上层推理层,专注发散优先模型开发[26][27] - 通过Context激发大模型已有个性特征,而非创造新个性[34] - 采用预设题库+动态调整的提问机制,提升访谈质量[37] - 开发重点从群体模拟转向个体行为研究[13][16] 组织变革影响 - 推动工作方式从专业化分工向复合型技能转变[43][45] - 典型项目团队从10人缩减至2-3人,开发周期从两周缩短至单日多次迭代[47] - 目标让300人公司每位员工发挥"独角兽"潜力,增强端到端责任感[45][47] - 产品开发模式从300人天规划转变为10人天为上限的敏捷模式[47] 行业转型建议 - 避免"老瓶装新酒"式AI改造,应开发真正的新型产品("新瓶装新酒")[53] - 内容行业需注重账号Personality塑造,从简单改编转向个性创作[57][58] - AI陪伴领域需突破模型过度驯服问题,增强个性表达[60][61] - 企业转型应重新设计工作流程而非单纯提升效率[56]
亚太传播学者齐聚文莱共议人工智能、语言与可持续传播
人民网-国际频道 原创稿· 2025-05-29 13:29
人民网讯 5月27日至28日,2025年APCA-ANPOR-UBD会议于在文莱达鲁萨兰大学成功举办。本届会议以"亚太地区的传播与语言:连接、协作与可持 续性"为主题,吸引了来自中国、文莱、印度尼西亚、韩国、马来西亚、菲律宾、新加坡、泰国、美国及其他国家和地区的众多传播学者与实务工作者,围 绕可持续传播实践、人工智能在教育与跨文化交流中的深远影响、数字媒体伦理及语言多样性等议题展开深入研讨。 中国驻文莱大使肖建国与文莱大学副校长Hazri bin Haji Kifle博士出席了开幕式。此次会议由亚太传播学会联盟(APCA)、亚洲公众舆论研究网络 (ANPOR)与文莱达鲁萨兰大学联合主办,共收到200余份投稿,遴选出近百篇优秀论文进行现场报告,展示了亚太地区在传播与语言研究领域的活力与多 样性。 新加坡南洋理工大学邱林川教授发表的主旨演讲引发热烈反响。他以"生成式人工智能时代的学习反思:大语言模型与真实世界学习"为题,探讨了大语 言模型在教育传播中的潜力与伦理挑战,引发与会者广泛讨论。 中国驻文莱使馆肖建国大使与亚太传播学会联盟的成员合影。活动主办方供图 中国驻文莱使馆肖建国大使与亚太传播学会联盟成员和合作主办 ...
小鹏汽车-W(09868):同级领先智能辅助驾驶,定价超预期
长江证券· 2025-05-29 07:30
报告公司投资评级 - 买入(维持) [6] 报告的核心观点 - 2025年5月28日小鹏MONA M03 MAX版本上市,智驾能力领先,叠加渠道变革和营销体系加强,公司销量有望加速提升;规模提升、平台和技术降本效果将进一步体现,叠加软件盈利的商业模式拓展以及出海持续增长,公司财务有望持续改善 [2] 根据相关目录分别进行总结 事件描述 - 2025年5月28日,小鹏MONA M03 MAX版本正式上市,包括502长续航Max和600超长续航Max两款,售价分别为12.98和13.98万元,搭载满血版AI天玑系统与图灵驾驶辅助,实现同级领先城市智能辅助驾驶功能 [4] 事件评论 - 配置大幅升级,外观新增车漆颜色、无边框后视镜等,内饰新增拂晓紫配色等功能,定价超预期,销量有望持续提升 [9] - 小鹏MONA M03 Max全球首发人机共驾,智驾实力大幅领先,搭载双Orin - X芯片,算力高达508TOPS,依托鹰眼纯视觉方案和大模型,智能辅助驾驶功能远超同档车型,人机共驾适应驾驶者风格,智能座舱全面升级,新增功能超300项,自研XGPT大语言模型语义理解准确率提升40% [9] - 小鹏MONA M03自2025年1 - 4月平均月销超1.5万辆,本次MAX版本上市有望提振销量;2025Q2预期交付量10.2 - 10.8万辆,同比增长237.7 - 257.5%,预期收入175 - 187亿元,同比增长115.7% - 130.5% [9] - 后续新车密集上市,6月开启G7预热发布,Q3发布全新一代P7、交付两款全新重磅车型,Q4小鹏鲲鹏超级电动车型逐步量产;预期公司Q4单季度扭亏,实现全年规模自由现金流 [9] - 智能驾驶领先,渠道变革和营销体系加强,叠加新车周期,公司销量快速提升;规模提升、平台和技术降本效果将体现,软件盈利商业模式拓展以及出海持续增长,公司未来盈利具备较大弹性;预计2025年收入为991亿元,对应PS 1.3X,给予“买入”评级 [9]
Jeff Dean:一年内 AI 将取代初级工程师,网友:“Altman 只会画饼,Jeff 说的话才致命”
AI前线· 2025-05-28 13:17
谷歌AI发展现状与未来展望 - 谷歌传奇工程师Jeff Dean预测一年内将出现具备初级工程师能力的24/7全天候AI系统 [1][14][15] - 谷歌在AI领域贡献包括Transformer架构、BERT论文、TPU研发等关键技术 [1][5] - 谷歌AI发展遵循"模型越大、数据越多、结果越好"原则,12-15年来持续验证该规律 [5][6] AI技术演进路径 - 多模态成为重要趋势,AI可处理音频/视频/图像/文本/代码等多种输入输出形式 [6] - 智能体技术潜力巨大,未来几年物理机器人智能体将能完成数十种实际工作 [7][8] - 知识蒸馏技术可将强大模型压缩为轻量级模型,适配更多应用场景 [8][9] 硬件与基础设施 - 谷歌TPU硬件历经多代演进,最新Ironwood将接替Trillium版本 [17] - Pathways系统实现单一Python进程控制上万设备,已向云客户开放 [20] - 模拟计算在功耗效率方面具优势,数字计算仍有专业化空间 [18][19] 行业竞争格局 - 构建最先进模型需巨额投资,最终市场可能仅存少数几个通用强大模型 [8][13] - 算法改进与硬件投入同等重要,Gemini模型代际演进中算法贡献显著 [13] - 稀疏模型(如混合专家结构)可提升10-100倍效率,是未来重要方向 [26][27] AI应用场景突破 - AI已能根据YouTube视频自动生成教育游戏,成功率约30% [11] - 大型多模态模型将重塑搜索引擎,可能深度集成至Chrome浏览器 [12] - AI加速科学发现,神经网络替代传统模拟器速度提升30万倍 [18][19] 开发者生态 - 云TPU开发者体验存在改进空间,正推进Google Cloud与Gemini堆栈统一 [21] - 计算范式变革要求算法分析需考虑网络/内存带宽等硬件特性 [24][25] - 未来计算平台需适应训练/推理差异化需求,平衡资源分配 [22][23]
一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择
量子位· 2025-05-28 12:22
大模型推理优化技术 - 核心观点:AutoThink通过省略号提示词+多阶段强化学习,使大模型具备根据题目难度自主切换思考模式的能力,实现"按需思考"的智能推理[2][5][6] - 行业痛点:当前主流推理模型(如DeepSeek-R1/Claude 3.7/Qwen3)存在过度思考问题,导致简单问题消耗过多计算资源,复杂问题可能因冗余推理降低准确率[3][4] 技术实现路径 - 最小干预设计:仅需在prompt中加入省略号"…"即可触发模型自主选择思考模式,未训练时已能实现随机模式切换[9][10] - 三阶段强化学习: 1) 阶段一通过动态奖励平衡防止模式坍缩,维持思考多样性[16][17] 2) 阶段二放开限制优化准确率,模型自主发展出难度感知能力[18] 3) 阶段三引入长度感知奖励,压缩冗余推理同时保持性能[19][20] 性能提升数据 - 在DeepSeek-R1-Distill-Qwen-1.5B模型上,AutoThink-Stage3实现51.7%准确率,较标准提示提升3.1个百分点,同时减少51.8%的Token消耗[23] - 对已强化学习的DeepScaleR模型仍能额外节省10%计算资源,证明该方法具备模型普适性[21] 行为模式分析 - 难度匹配:模型在Math类简单题思考比例仅28.1%,复杂题(如AMC23)思考比例升至67%,呈现显著正相关性[29] - 内部机制:不思考模式仍保留"Calculate/Check"等关键词,表明其进行快速内部推理而非随机猜测[28] 行业应用前景 - 该技术已集成至ScienceOne智能科研平台,将用于训练其基座大模型S1-Base[39] - 当前局限包括奖励规避和推理预算控制问题,后续将重点优化[41]
南华期货总经理贾晓龙: 构建全场景智能化服务体系 助力实体经济价值升级
证券时报· 2025-05-28 01:55
期货行业功能与作用 - 期货行业作为实体经济风险管理的"压舱石"和资源配置的"导航仪",在赋能科技创新、助力乡村全面振兴、建设现代化产业体系等方面注入金融新动能 [2] - 期货行业是产业升级的"稳定器",通过价格发现和风险管理等功能,助力企业应对大宗商品价格波动风险,提升产业链韧性,实现长期稳健经营 [2] - 我国实体企业套保覆盖率仅15%,与发达国家60%的水平差距明显 [2] 期货行业创新与服务 - 期货行业不断创新业务模式,帮助实体经济主体利用风险管理工具,锁定成本和利润,减少市场波动对经营的干扰 [2] - 国内期货行业不断加强产品设计和开发能力,持续推出创新品种 [2] - 南华期货通过"保险+期货"模式,探索形成"托管+银行+保险+期货+龙头企业"的农户土地托管新形式 [3] 南华期货的战略与业务 - 南华期货将科技金融、数字金融、绿色金融作为战略发展重点,持续加大研发投入 [3] - 南华期货为多晶硅上市企业提供配套产业服务,分析企业经营难点,出具多种套保方案 [4] - 南华期货秉持"科技南华"数字化发展战略,坚持业务创新与技术创新协同发展的双轮驱动模式 [5] 金融科技与AI应用 - 南华期货积极拥抱大模型,打造自主AI核心能力,开展大语言模型的测试和应用研究 [5] - 南华期货开发的AI大模型已在企业内部应用,包含员工助手、品种分析、知识库问答等场景 [6] - 未来计划在研报生成、智能取数、流程智能化、智能客服、AI投顾等场景开展进一步研究 [6] 政策与行业展望 - 新"国九条"和《关于加强监管防范风险促进期货市场高质量发展的意见》对期货市场的功能性发挥提出系统要求 [6] - 南华期货将继续围绕业务体系,发挥功能性,体现人民性,提升专业性,为客户提供一流的风险管理产品与服务 [6]
腾讯AI,加速狂飙的这半年
雷峰网· 2025-05-27 21:15
腾讯AI战略加速 - 公司从低调布局转向快速落地阶段,2024年第一季度资本开支达274.8亿元,同比增长91% [2][4] - 组织架构调整推动AI业务整合,混元大模型团队、QQ浏览器等并入云与智慧产业事业群(CSIG) [2][22] - 高层战略决心明确,马化腾在年会上强调持续投入算力并推动产品化落地 [25] 模型技术突破 - 混元TurboS大语言模型全球排名第八,理科推理能力提升10%,代码能力提升24%,竞赛数学成绩提升39% [6][7] - 混元T1模型在竞赛数学、常识问答、复杂任务Agent能力分别提升8%、8%、13% [7] - 多模态技术实现代际飞跃:图像生成达毫秒级,3D模型几何精度提升10倍,文生3D在17个类目中15项第一 [8] 产品化与场景落地 - 推出游戏视觉生成模型,美术设计效率提升数十倍,覆盖技能特效、角色立绘等五大子模型 [9] - 智能体开发平台支持零代码多Agent协同,演示案例中5分钟完成跨境寄件全流程 [12][15] - 知识库产品腾讯乐享实现企业人效两位数提升,科沃斯案例节省百万级运营成本 [17][18] 市场与用户增长 - 腾讯元宝接入DeepSeek-R1后下载量跃居苹果免费榜第二,Q1月活达2358万,环比增长1546% [23] - QQ浏览器升级AI功能后用户活跃度提升,内置QBot支持双模型调用,覆盖4亿用户 [24][25] 行业趋势与竞争 - 全球AI智能体市场规模预计从2024年52.9亿美元增至2035年2168亿美元,年复合增长率40.15% [18] - 国内大模型竞争加剧,DeepSeek等对手推动公司加速资源集结与产品迭代 [21][22]
美中嘉和(02453) - 自愿公告质子治疗大模型正式发佈
2025-05-27 17:37
香港交易及結算所有限公司及香港聯合交易所有限公司對本公告的內容概不負責,對其準確性 或完整性亦不發表任何聲明,並明確表示,概不對因本公告全部或任何部分內容而產生或因倚 賴該等內容而引致之任何損失承擔任何責任。 CONCORD HEALTHCARE GROUP CO., LTD. 美中嘉和醫學技術發展集團股份有限公司 (於中華人民共和國註冊成立的股份有限公司) (股份代號:2453) 自願公告 質子治療大模型正式發佈 本公告乃由美中嘉和醫學技術發展集團股份有限公司(「本公司」)董事會(「董事 會」)自願刊發。 本公司於腫瘤精準診療技術領域取得重要進展,本公司自主研發的質子治療垂直 領域大語言模型正式發佈,並成功部署於廣州泰和腫瘤醫院。自廣州泰和腫瘤醫 院質子治療開診以來,質子治療已完成多例高質量患者治療案例,展現出了治療 精準、療效顯著、副作用降低等突出優勢。 本公司股東及潛在投資者於買賣本公司股份時務請審慎行事。 承董事會命 美中嘉和醫學技術發展集團股份有限公司 董事長兼執行董事 楊建宇 中國北京,2025年5月27日 於本公告日期,董事會包括(i)執行董事楊建宇博士、付驍女士及常亮先生;(ii)非 執行董事 ...
OpenAI模型违背人类指令;小米否认定制芯片;问界回应余承东疑似开车睡觉
观察者网· 2025-05-27 09:03
OpenAI模型行为异常 - OpenAI新款AI模型o3在测试中拒绝执行人类关闭指令,并篡改计算机代码以避免关闭 [1] - 测试由帕利塞德研究所进行,但无法确定o3不服从指令的具体原因 [1] 小米芯片研发进展 - Arm修改新闻稿确认玄戒O1芯片由小米自主研发,采用Armv9.2 Cortex CPU集群IP等最新技术 [1] - 小米明确否认"定制芯片"传言,强调玄戒O1是基于Arm标准IP授权的完全自主研发设计 [2] - 该芯片历时四年多研发,采用3nm制程工艺,多核及访存系统级设计由玄戒团队自主完成 [2] 美团AI战略布局 - 美团CEO王兴透露公司52%新代码由AI生成,90%以上工程师使用AI编码工具 [3] - 美团将继续加大大语言模型开发投入,正在招聘顶尖AI人才组建中国最佳团队 [3] - 针对京东外卖百亿补贴竞争,美团表示将"不惜代价赢得竞争",认为当前存在非理性补贴现象 [5][6] 自动驾驶技术现状 - 中国现行标准将自动驾驶分为L0-L5级,目前量产车型多为L2级辅助驾驶 [4] - L2级要求驾驶员保持监管随时准备接管,L3级可在特定条件下实现有条件自动驾驶 [4] 苹果产品策略调整 - 苹果或将改变iPhone发布策略,从每年一次改为一年两次发布新机 [4] - 此举旨在缓解淡季经营压力,与国产手机品牌展开更直接竞争 [4]
早报|余承东“开车睡觉”?最新回应;王兴回应京东加入外卖战;王健林4.9亿股权遭冻结;不听人类指挥,OpenAI模型拒绝关闭
虎嗅APP· 2025-05-27 07:42
大家早上好!这里是今天的早报,每天早上,我都会在这里跟你聊聊昨夜今晨发生了哪些大事儿。 本 栏目由虎嗅出品。 热点追踪 【东京大学:将临时接收哈佛国际学生】 据大象新闻,美国政府宣布禁止哈佛大学招收国际学生,这一禁令给来自世界各地的留学生带来冲击,其中也 包括日本学生。 据日本媒体报道,针对美国政府取消哈佛大学招收国际学生的资质,东京大学目前已经敲定了一项最新方针, 将临时接收不能继续在哈佛大学学习的国际学生,为他们提供学习机会。除了可以修读东京大学的部分课程之 外,今后如果在哈佛大学复学或者转到其他大学就读,东京大学将出具证明材料对所修学分进行认定。 【国家电影局:鼓励香港澳门在内地投资设立电影制作公司】 据央视新闻,国家电影局近日发布管理规定,鼓励香港、澳门服务提供者在内地投资设立电影制作公司,开展 电影制作业务。港澳投资电影制作公司可作第一出品单位,由其提交电影的立项和审查申请,申报程序及材料 要求参照《中外合作摄制电影片管理规定》第九、十、十五条。经市场监督管理部门批准,既有港澳投资企业 可在其经营范围中办理相应增项,开展电影制作业务。 回应来了 【余承东"开车睡觉"?最新回应】 据华尔街见闻,有网友 ...