通用人工智能
搜索文档
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”
量子位· 2025-08-09 15:01
数据集发布与核心价值 - 上海创智学院与上海交通大学GAIR Lab联合发布MegaScience数据集,包含125万条跨学科问答对,覆盖生物学、化学、计算机科学等7大领域,旨在提升通用AI系统的科学推理能力[1] - 数据集采用大学教材作为核心数据源,通过12万本教材构建65万条问答对(TextbookReasoning子集),确保答案权威性,最终混合形成125万条数据的MegaScience全集[14][15] - 发布一周内下载量突破4.6k次,登上HuggingFace Datasets Trending榜单第四位,显示学术界与工业界的强烈需求[7] 技术创新与解决方案 - 开发四阶段系统性方案:构建15个Benchmark的评估体系、大模型驱动的数据去污染、教科书级数据源采集、聊天模型优化的数据精炼流程[13] - 采用全自动化LLM流水线处理教材数据,包含OCR转换、双重问答抽取(高标准/低标准)、LSH去重、DeepSeek-V3精炼、Llama3.3污染检测等5大步骤[17][19][20][23][24][25] - 创新数据筛选策略:基于回答长度(保留最长回答)、问题难度(Qwen2.5模型评分1-10分过滤简单题)、随机采样三重方法优化数据集质量[30][31][32] 性能表现与模型验证 - 在Qwen2.5-7B模型上,MegaScience微调版相比官方Instruct模型提升2.21%平均性能,在SciBench等计算类任务中优势达5.78个百分点[42] - 模型规模扩展性显著:Qwen3-14B经MegaScience训练后性能超越官方Instruct模型2.82%,30B版本差距扩大至3.24%,显示大模型获益更明显[44][45] - 数学推理呈现能力门槛效应,仅Qwen2.5-7B及以上规模模型能有效吸收数据集中的高难度数学内容(大学本科级概念)[46] 开源生态与评估体系 - 完整开源体系包含:数据集本体(CC-BY-NC-SA 4.0协议)、数据构建代码、评估系统(Language Model Open Science Evaluation框架)、预训练模型[5][37][48] - 评估框架覆盖15个Benchmark,创新两阶段答案抽取技术解决传统\boxed{}格式局限,支持选择题/计算题/判断题/简答题全题型[38][39] - 提供跨模型验证结果:在Llama3.1-8B、Qwen全系列(1.5B-30B)上均观察到性能提升,最高达73.86平均分(Qwen3-30B)[43][44]
GPT会冲击多邻国吗?大摩:语言学习最大的挑战是“动机”,AI不是竞争者而是加速器!
美股IPO· 2025-08-08 13:14
核心观点 - 摩根士丹利认为市场对GPT5等大模型威胁多邻国护城河的担忧是错误的,AI反而是其增长的加速器 [1][3] - 语言学习的核心挑战是用户持续练习的动力而非技术,多邻国通过游戏化、社交和趣味性设计建立了强大的用户粘性 [5][6] - AI赋能已显著提升多邻国的内容创作效率、成本效益和规模化能力,进一步巩固其护城河 [7][9] 竞争护城河分析 - 多邻国的月度使用时长和会话次数是其最接近的移动端竞争对手Babbel的三倍以上 [6] - 日活跃用户与月活跃用户的比率(DAU/MAU)自2019年以来翻了一番,证明用户粘性持续增强 [6] - 新竞争者需在不牺牲趣味性和内容深度的情况下提供体验好得多的产品才能构成威胁,这是极难完成的任务 [6] AI赋能成果 - 生成式AI使多邻国在不到两年内将可用课程总数翻倍至超过275门,课程总级别数增加4倍以上 [9] - "Vibe Coding"模式让两名非技术员工设计的国际象棋课程在一年内吸引超过100万日活跃用户 [9] - AI生成的听力功能DuoRadio将日活跃用户从10万扩大到550万,同时成本降低99% [9] AI对业务的影响 - AI提升多邻国的学习效果、内部效率和商业化能力,是其发展的"超级燃料" [7][8] - 内容和代码生成成本下降使多邻国能将A/B测试应用于前期投入巨大的新课程模块 [7] - 更强的AI模型将加速多邻国的发展飞轮,持续改善关键绩效指标 [7]
特朗普称美将对芯片和半导体征收约100%的关税|首席资讯日报
首席商业评论· 2025-08-08 12:10
太古地产中期业绩 - 2025年上半年收入87.23亿港元 同比增长20% [2] - 股东应占亏损12.02亿港元 上年同期盈利17.96亿港元 [2] - 拟派中期股息每股0.35港元 [2] 安徽省人工智能产业规划 - 以"人工智能+"行动为牵引 打造通用人工智能产业创新和应用高地 [3] - 深化原创性技术突破攻坚 加强创新创业团队招引 [3] - 建设一批重大应用场景 [3] 淘宝88VIP权益升级 - 会员权益再升级 叠加七周年庆和淘宝大会员额外权益 [5] - 会员价格保持不变 [5] - 生态联动加码 会员粘性提升 阿里消费闭环深化 [5] 台积电投资争议 - 特朗普称台积电将投资3000亿美元在亚利桑那州建芯片工厂 [6] - 台经济部门负责人最初称"假讯息" 后改口表示不知情 [6] 索尼PS5销售情况 - 2025财年第一季度PS5销量250万台 上年同期240万台 [7] - 同比增长4% 稳居市场头部 [7] - 生态优势持续发力 [7] 阿里巴巴退出印度投资 - 将通过大宗交易退出印度Eternal公司 交易价值537.5亿卢比(约6.13亿美元) [12] - 出售2.08%股份 底价285卢比 较收盘价折价4.6% [12] 中国外贸数据 - 前7个月货物贸易进出口总值25.7万亿元 同比增长3.5% [8] - 对东盟增长9.4% 欧盟增长3.9% 非洲增长17.2% 中亚增长16.3% [8] 理想汽车法务行动 - 法务部声明称网络平台出现大量针对车主的负面评价 [10] - 认为涉嫌有组织的违法犯罪 损害用户形象 [10] - 将采取法律手段维护权益 [10] 美国芯片关税政策 - 特朗普称将对芯片和半导体征收约100%关税 [11] - 在美制造将不收取任何费用 [11] 教育政策 - 免保育教育费政策覆盖所有幼儿园大班儿童 [9] - 预计秋季学期惠及约1200万人 [9]
OpenAI终于发布大杀器,马斯克各种不服,网友却笑不活
新浪科技· 2025-08-08 09:23
产品发布与性能 - OpenAI发布新一代大模型GPT-5 在文本、编程和数学等领域空降竞技场头名 且更快更高效 [1] - GPT-5显著降低幻觉率 经过5000小时安全评估 采用安全完成机制避免风险回答 [9] - GPT-5是集成模型 自动决定模型调动和推理需求 无需用户手动选择 [11] - GPT-5支持多版本:GPT-5、GPT-5 mini、GPT-5 nano和GPT-5 pro 面向不同付费用户群 [13] - GPT-5提供人格选择功能 包括愤世嫉俗者、书呆子等角色 [13] - 免费用户首次获得推理模型访问权限 但完整功能需订阅每月200美元的Pro计划 [13] 技术特性与创新 - GPT-5引入按需软件概念 通过自然语言指令即时生成、调用并执行功能 颠覆传统软件形态 [9] - AI Agent功能强化 可在无监督下完成复杂任务链 如自动检索、分析、生成报告并发送邮件 [9] - 编程能力突出 支持氛围编程 用户通过简单提示生成软件 例如几秒内创建法语学习应用 [10] - 模型支持输入缓存 最高90% 降低使用成本 [15] 市场竞争与定价 - API定价发起价格战:GPT-5输入成本每百万token 1.25美元 输出成本10美元 GPT-5-nano输入成本0.15美元 输出成本1.5美元 低于谷歌和Anthropic等竞争对手 [15][16] - ChatGPT周活跃用户达7亿人 OpenAI在行业保持领先地位 [14] - 竞争对手马斯克声称Grok-4 Heavy比GPT-5更强 并在发布会后持续展示其性能 [17] 战略合作与生态整合 - 微软宣布GPT-5今日集成至Microsoft 365 Copilot、消费者Copilot及Azure AI Foundry [20] - 微软与OpenAI谈判修改合作条款 确保持续使用最新技术 微软已投资137亿美元 是最大股东和算力提供方 [22] - OpenAI与谷歌、甲骨文达成云服务合作 寻求扩大营收分成 [22] 公司估值与人才竞争 - OpenAI估值达5000亿美元 成为全球最高估值创业公司 较1月2600亿美元提升近一倍 [24] - 员工可通过二级出售套现 每人预计获利200万至1000万美元 [24] - Meta发起猛烈挖角 开出上亿美元年薪瞄准OpenAI和谷歌人才 OpenAI以150万美元奖金和持股变现机制应对 [25][27] - Meta挖角导致内部士气动荡 原有员工考虑外部机会 [27]
上证早知道|事关脑机接口,七部门发文!央行,连续增持!海关总署,最新公布!
上海证券报· 2025-08-08 07:08
脑机接口产业发展 - 七部门发布推动脑机接口产业创新发展的实施意见 重点发展辅助生理信号设备和植入脑机接口的高精度手术机器人 [9] - 2030年全球脑机接口市场规模预计达70亿美元 2025-2030年复合增长率16.4% [10] - 2023年中国脑机接口市场规模17.3亿元 全球占比较2020年提升超5% [10] 黄金与外汇储备动态 - 中国7月末黄金储备7396万盎司 环比增加6万盎司 连续第9个月增持 [2][6] - 7月末外汇储备规模32922亿美元 较6月末下降252亿美元 降幅0.76% [6] 粤港澳大湾区外贸表现 - 大湾区内地9市2019年以来累计进出口50.67万亿元 [2][6] - 2025年前7个月进出口5.2万亿元 增长4.7% [6] - 出口中国近70%数字照相机和超80%3D打印机 进口超40%存储器和超60%电脑处理部件 [6] 人工智能与算力发展 - OpenAI预告GPT-5发布 模型规模扩大2-3倍可实现近10倍智能水平提升 [12] - 蜂窝物联网连接数预计2030年达51亿 受5G RedCap等三项关键技术推动 [6] - 2025年第二季度全球半导体销售额1797亿美元 同比增长近20% 环比增长7.8% [7] 企业合作与订单 - 道氏技术与共济科技等合作建设原子级科学计算算力中心 [14] - 先惠技术签订7.02亿元销售合同 预计对2025-2026年度业绩产生积极影响 [16] - 源杰科技获得1.41亿元大功率激光器芯片销售订单 [17] 资本市场动态 - 8月6日权益类ETF单日净流入71亿元 中证1000ETF获12.05亿元净申购 [20] - 近30只主动权益基金7月以来实施限购 汇添富香港优势精选已暂停申购 [20] - 药明康德完成H股配售募集76.47亿港元 90%用于全球布局和产能建设 [18] 区域产业政策 - 安徽省政府部署抢占通用人工智能产业制高点 实施"人工智能+"行动 [5] - 上海制定2026-2028年城市更新行动方案 探索可持续更新模式 [5] - 中央财政对免保育教育费补助资金拿大头 中西部地区获倾斜支持 [4]
“让算力的使用像电力一样便捷”(弘扬科学家精神·对话)
人民日报· 2025-08-08 06:40
鹏城实验室项目进展 - 鹏城云脑Ⅲ建设正推进 预计2026年完成 [3] - 中国算力网首条专线将于2025年11月开建深圳至贵阳线路 预计2026年建成 [3] - 第四代数字音视频编解码技术标准(AVS4)正在研发中 [3] 算力基础设施发展 - 鹏城云脑Ⅱ为我国首个自主可控E级智能算力平台 算力达1000P(每秒十亿亿次计算) [6] - 鹏城云脑Ⅲ算力将达16000P 是前代平台的16倍 [6] - 算力网建设需突破四大技术难关:自主算力供给、单芯光纤传输容量限制、协同调度系统开发及安全计算环境构建 [7] 音视频技术突破 - AVS标准使音视频编码容量显著降低 有效减少传输与存储成本 [4][5] - 该标准已广泛应用于国内高清/4K/8K超高清视频产业 [5] - 技术研发源于2002年DVD专利事件后 为打破国外技术垄断而启动自主标准研发 [9] 人工智能算力应用 - 鹏城云脑Ⅱ具备24小时内处理100亿张图像或1000万小时语音或1万天自动驾驶数据的训练能力 [6] - 算力网建设目标为实现算力资源高效调度 使算力使用像电力一样便捷 [7] - 当前人工智能技术距离通用人工智能仍有较大差距 需持续完善法律与伦理规范 [12] 科研机构战略定位 - 实验室定位为国家战略科技力量"领头雁" 聚焦前沿技术攻关 [13] - 采用"不求所有但求所用"的灵活人才机制 提供宽松科研环境 [13] - 2021年起开展联合培养博士生计划 注重青年科研人员在国家重大任务中的历练 [13]
OpenAI首席执行官:与GPT-5交流“像是在与任何领域的专家交谈”
新浪财经· 2025-08-08 01:27
人工智能发展 - GPT-5被描述为迈向通用人工智能道路上的"重要一步",通用人工智能指人工智能具备与人类相当的思维能力 [1] - GPT-4的对话能力相当于与大学生交谈,而GPT-5首次达到与博士级别专家对话的水平 [1]
星尘智能Astribot Suite技术解读:让机器人帮你做家务的全身控制解决方案 | Jinqiu Spotlight
锦秋集· 2025-08-07 23:02
核心观点 - 锦秋基金领投星尘智能A轮融资 该基金专注于具有突破性技术和创新商业模式的通用人工智能初创企业[1] - 星尘智能发布Astribot S1人形机器人技术报告 展示其在家务助手领域的创新技术[4] - Astribot S1采用绳驱技术路线 在硬件设计、数据采集和学习算法方面实现突破[6][9][11] - 公司开发低成本全身遥操作系统 使非专业用户也能训练机器人[13][16] - DuoCore-WB学习算法实现高效模仿学习 在多项家务任务中达到80%以上的成功率[19][22][30] 技术亮点 硬件设计 - 采用绳驱技术路线 具有高分辨率力控制(传动效率>90%)、强负载能力(提升4倍)、低反向间隙(仅为半直驱系统的30%)等优势[11] - 人形结构设计:7自由度双臂、4自由度躯干、2自由度头部 垂直可达2米 单臂可举5kg 手部速度达10m/s 定位精度±0.1mm[10] - 多传感器配置:头部、胸部和手腕安装多个摄像头 配备激光雷达实现360度环境感知[10] 数据采集系统 - 开发低成本(300美元)全身遥操作系统 使用VR设备(Meta Quest 3S)实现100Hz运行频率和20ms延迟[13] - 提供第一人称和第三人称两种操作模式 支持高质量动作示范录制[15] - 系统成功复现操作员动作 跟随误差小 适合家庭用户使用[17] 学习算法 - DuoCore-WB算法采用"感知-生成一体化"动作模型 使用三路同步相机视觉信息和条件扩散模型生成动作[20][21] - 创新性地在末端执行器空间学习 相比关节空间策略成功率提升5-65个百分点[22] - 采用增量式学习策略 使动作更平滑 平均步进降低41% 突变减少84%[24] - 开发RTG后处理模块 以250Hz频率输出动作 实现动作片段间的平滑过渡[25][28][31] 应用成果 - 在6项家务任务测试中平均成功率80% 其中"扔玩具逗猫"达到100%成功率[30][42][43] - 具体任务表现: - 递送饮料:整体成功率87% 开门成功率14/15[32][35] - 储存猫粮:成功率95% 能搬运2kg重物[36] - 整理鞋子:成功率80%[41] - 收拾玩具:双臂协调操作成功率80%[46] 未来发展 - 团队计划在硬件、人机交互和模型算法上继续深化 推动机器人技术进入更广阔的现实世界应用[47] - 当前在需要灵巧性或长期记忆的任务上仍有局限 但已为下一代智能机器人奠定重要基础[47]
华人AI工程师被抢红眼?扎克伯格的AI天团集齐清北浙学霸|AI料王半月谈
搜狐财经· 2025-08-07 19:16
AI人才竞争态势 - Meta向AI人才提供200万美元年薪底线 曾为澳大利亚科学家Tulloch提供15亿美元6年期薪酬方案[5] - 扎克伯格为顶级AI人才余家辉提供4年3亿美元薪酬方案 首年薪酬超1亿美元 苹果基础模型团队负责人庞若鸣转投Meta获2亿美元薪酬[5] - 科技巨头通过神秘电话和邮件展开天价抢人 华人工程师成为重点目标 硅谷企业出现"精准斩首"式人才争夺[1] 顶尖AI人才背景特征 - 被挖角人才多具顶尖学术背景:杨格毕业于哈佛大学数学系 戴子航曾任谷歌高级研究员 张国栋为浙大本科多伦多大学博士[7] - 华人工程师本科多在中国完成 中国高等教育人才含金量获国际认可 Meta挖角的众多华人工程师中多人本科在国内完成[10] - 核心人才拥有头部企业任职经历:Tulloch曾任职高盛、Facebook和OpenAI 余家辉先后在Google Brain和OpenAI参与里程碑式模型研发[5][7] 企业人才流动格局 - OpenAI成为主要挖角对象 但管理问题导致人员流失 面对巨头竞争仅能提供股权和企业文化作为留人手段[12] - 中国科技公司加入人才竞争 字节跳动挖来谷歌DeepMind前副总裁吴永辉 显示中国企业对AI竞争的野心[10] - 研究人员偏好小规模灵活研究环境 对Meta广告商业模式存顾虑 认为OpenAI在通用人工智能领域更具领先优势[12] 行业薪酬结构变化 - 99%资金流向1%顶尖AI人才 硅谷人才战争升级为"精准斩首"行动[1] - 谷歌、亚马逊、微软、Meta与AI初创公司签署协议收编顶尖人才[1] - Meta从苹果挖走第三个AI核心人才 导致苹果Siri开发受到影响[1]
比尔·盖茨:用人工智能来提升工作质量
36氪· 2025-08-07 15:16
书籍背景与创作动机 - 书籍《AI First: The Playbook for a Future-Proof Business or Brand》由数字战略专家亚当·布罗特曼和安迪·萨克合著 旨在为企业提供整合人工智能的行动指南 [2] - 作者因ChatGPT的出现改变原定数字忠诚度书籍计划 转向探索生成式人工智能技术发展并分享见解 [3] - 书籍采访了科技界最具影响力的领袖 包括OpenAI首席执行官山姆·奥特曼 微软联合创始人比尔·盖茨和领英联合创始人雷德·霍夫曼 [2] 人工智能技术特性 - 人工智能被描述为"智能即服务" 具备类似人类的思考与推理能力 与传统可编程软件存在本质差异 [6] - 技术发展速度极快 OpenAI首席执行官山姆·奥特曼预测通用人工智能可能在五年左右实现 [7] - 比尔·盖茨将首次看到ChatGPT4的体验比作首次见到图形用户界面 强调该技术具有革命性意义 [8] 企业应用与组织转型 - 企业应避免直接跳入具体应用如聊天机器人 需优先培养以AI为先的人才体系 [9] - 人工智能应被视为协作同事 参与决策过程并提供建议 沃顿商学院教授埃坦·莫利克支持此观点 [10] - 当前阶段企业仍有机会制定AI整合计划 但需立即行动避免落后时代发展 [11] 生产力维度拓展 - 比尔·盖茨提出生产力不仅包含量化产出 更包含质量维度 生成式人工智能可同步提升工作质量与效率 [8] - 人工智能能显著提升日常决策 分析与洞察能力 使工作完成更高效更优质 [9]