Founder Park

搜索文档
普及了语音通话技术,曾经有6亿用户的Skype正式关停
Founder Park· 2025-05-07 14:15
Skype的关停与历史回顾 - 微软于5月5日正式关闭Skype服务 但Skype for Business业务不受影响 用户可迁移至Microsoft Teams免费版 [1] - Skype成立于2003年 曾是全球语音通话领域的领导者 定义了在线通信时代 最终结束运营 [2] - 2007年Skype处于巅峰期 提供高质量语音及视频通话 覆盖全球大多数用户 支持跨平台运行 2009年拥有4 05亿用户 占全球跨国通话时长的8% [6][7] Skype的技术架构与市场策略问题 - Skype采用P2P技术架构 早期节省成本但后期难以维护 微软迁移至云端代价巨大 [9] - 移动时代到来后 P2P架构与手机系统不兼容 全球移动网络复杂性加剧了技术问题 [9] - 微软收购后策略失误 关闭Windows Live Messenger押注Skype 但陷入功能堆砌与界面频繁改动的困境 [9] Skype的定位与产品管理问题 - 产品定位混乱 官方宣称面向个人用户 但实际主要用户为中小企业 战略上禁止开发企业功能 [15][17] - 微软收购后重心转向拉新而非技术优化 功能堆砌导致用户体验下降 代码老化引发频繁崩溃 [19] - 疫情期间用户激增 但因技术债务和团队缩编错失机会 用户转向Zoom [21] 微软的战略调整与Teams的崛起 - 微软选择自研Teams而非收购Slack Teams沿用Skype后台但获得全力支持 借助Office 365捆绑快速发展 [25] - Skype虽仍有几千万月活用户 但在微软业务版图中价值有限 最终因资源倾斜和变现压力加速没落 [23][24] - Teams取代Skype成为微软通信核心 反映公司战略重心转向企业市场 [10][22] 行业影响与历史评价 - Skype曾提出"一站式通信系统"愿景 但最终被封闭平台生态取代 如Zoom GoogleMeet WhatsApp等 [11] - 行业评价Skype为"伟大的商业失败者" 其独立通信基座的理念仍具前瞻性 但难以在商业化环境中持续 [12][13]
谷歌上线 Gemini 2.5 Pro 新版本,编码能力超 Claude 3.7 Sonnet
Founder Park· 2025-05-07 11:17
产品发布 - 谷歌提前推出Gemini 2.5 Pro Preview(I/O版),重点提升编码和多模态推理能力 [1] - 新版本在LMArena编程排行榜和WebDev Arena排行榜均位列第一,得分超过Claude 3.7 Sonnet [1][9] - 开发者可通过Google AI Studio和Vertex AI使用Gemini API构建应用 [1][21] 技术能力 - 成为首个横扫文本、视觉和WebDev领域的单一模型 [4][10] - 在WebDev Arena排行榜位列第一,专门衡量构建美观且功能强大Web应用的能力 [12] - 与之前版本相比得分上涨147分 [13] - 在VideoMME视频理解测试中获得84.8%的得分 [19] 应用场景 - 只需手绘草图即可构建"绘图变音频"网页应用 [5] - 通过单句提示词实现游戏开发、对象模拟等功能 [6] - 可从YouTube视频创建交互式学习应用 [18] - 能复刻Windows 95风格视频播放器等复杂UI设计 [21] 市场反馈 - 因用户热情高涨,公司决定提前发布原计划在Google I/O大会推出的版本 [22][23] - 已被Cursor背后公司、Cognition和Replit等采用 [15] - 此前Gemini 2.5 Pro在直播中通关《宝可梦蓝》游戏,打破Claude记录 [24]
中国 AI 投资人:练习时长两年半
Founder Park· 2025-05-06 20:05
大模型行业动态 - 中国大模型能力获得认可,行业进入新篇章 [2][5] - DeepSeek推动中国AI生态良性变化,改变科研评价标准 [33][34] - 大模型发展进入L2阶段,对L1产品形成降维打击 [38][39] - 模型公司融资趋缓,资金开始流向应用层 [52][56][58] Manus成功经验 - 实现全球化营销和海外融资突破 [13][14] - 通过PLG方式实现快速增长,吸引硅谷投资 [15] - 团队具备快速调整产品方向的能力 [16] - 真格基金连续投资四次,看重创始人战略定力 [17][18][20] DeepSeek行业影响 - 降低大模型使用成本,促进小模型发展 [36] - 普及推理能力,提供宝贵训练数据 [37] - 推动AI商业化,降低客户教育成本 [37] - 证明L2对L1产品的降维打击 [38] 创业投资策略 - 应用层投资逻辑回归产品、用户需求和商业模式 [55][59] - 垂直领域机会多于通用领域 [97][98][106] - 早期创业者应关注小而美的闭环验证 [94][95] - ARR指标争议大,更应关注用户行为质量 [93][96] AI硬件与玩具 - Plaud Note年收入7000万美元,缺乏竞争对手 [76][81][83] - AI玩具应避免过度依赖"可爱"属性 [127] - 玩具开口说话可能破坏想象空间 [130][136] - 创造独特IP和玩法比单纯智能化更重要 [137][138] 技术发展趋势 - 视频生成技术处于早期采用阶段 [70] - AI基础设施比云计算时代更复杂 [70] - 多模态模型变化快于语言模型 [63][64] - 工具链设计需要预留技术突破冗余度 [64][65]
OpenAI大动静:放弃盈利性转型,30亿美元收购Windsurf
Founder Park· 2025-05-06 14:36
本篇文章部分内容转 载自公众号 「腾讯科技」 Founder Park 正在搭建「 AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群: 进群后,你有机会得到: 最新、最值得关注的 AI 新品资讯; 不定期赠送热门新品的邀请码、会员码; 最精准的AI产品曝光渠道 当地时间5月5日, OpenAI发布声明宣布对公司架构进行调整,放弃将公司转向营利性组织的计 划,将继续由非盈利组织控制。现有的营利性组织(LLC)将调整为 公益责任公司(PBC)。 于此同时,彭博社今日发文称,据 知情人士消息,OpenAI已同意以约30亿美元的价格收购AI编 程公司Windsurf。若最终收购达成,这将是 OpenAI迄今为止最大的一笔收购。 01 如果你想提交自己的产品,点击文末的 「阅读原文」 即可。 放弃盈利转型, 非盈利组织将持有多数股份 当地时间5月5日, OpenAI发布声明宣布对公司架构进行调整, 山姆・奥特曼也发布全员信, 谈及OpenAI的愿景、使命、资本架构等外界关心的问题。 OpenAI董事会主席布雷特・泰勒在与记者的视频通话中表示," 在我们正在筹划的架构下,非 营利实体将继续掌控OpenAI。 ...
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
Founder Park· 2025-04-30 20:31
产品发布与市场表现 - BabelDOC PDF工具开源后冲进Github全站全开发语言Trending榜前三[2] - 新增多语种支持功能 支持拉丁字母语言与简繁中文/日文/韩文互译[2] - 免费用户每月1000页解析额度 Pro用户可达10000页 分别使用GLM-4-FLASH和DeepSeek翻译模型[3] 技术实现原理 - 采用AI布局识别技术 完整解析PDF结构包括图表/脚注/公式等非文本元素[7] - 翻译流程分为四步:布局识别→文本提取→样式匹配→智能渲染[7][8][9][11] - 特殊处理机制:富文本部分翻译 数学公式保留原字符形式[10] - 最终实现像素级版式对齐 保持学术论文/招股书等专业文档的原始布局[7] PDF格式特性分析 - PDF由Adobe联合创始人John Warnock发明 核心解决跨设备显示一致性问题[13] - 2008年成为ISO国际标准(ISO 32000-1:2008) 相比DOCX具有固定格式/强兼容性/高安全性等优势[13][14] - 文件结构呈树形分布:文件头尾(二进制标识)→交叉引用表(资源定位)→页面树(元素引用)→内容流(绘制指令)[16][18][19] 行业生态建设 - Founder Park搭建AI产品市集社群 提供新品资讯/邀请码/曝光渠道等资源[4]
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
Founder Park· 2025-04-30 20:31
模型发布与能力升级 - OpenAI发布o3和o4-mini模型,o3具备最全面的推理能力、丰富的tool use方式和全新的多模态CoT能力 [8] - o4-mini专为高效推理优化,部分benchmark表现优于o3,但实际使用中思考时间更短 [8] - 模型首次实现将图像直接融入CoT中,能"看懂"图像并用图像思考,在多模态理解benchmarks中领先 [45] - o3在外部专家评估中比o1少犯20%重大错误,能意识到自身能力边界并拒绝无法解决的问题 [61] 技术路线与产品策略 - Agent产品分化出两类路线:OpenAI黑盒化端到端训练路线和Manus白盒化虚拟机模仿人类工作方式路线 [15] - OpenAI将Agent产品作为未来商业化收入占比的大头 [4] - OpenAI开源Codex CLI,具备多模态推理能力和本地代码环境集成特性,旨在普及竞争对手产品 [64][68] - OpenAI采用先训练mini reasoning版本再scale到full model的发布策略,与GPT系列先大后小的策略不同 [9] 能力测试与表现 - o3在YC官网信息收集任务中经过两次prompt后完成90+家公司信息整理,而Manus能一次性完成但速度较慢 [16][17] - 在Amazon销售数据分析任务中,o3比Manus给出更简洁专业的策略建议和可视化效果 [19][27][28] - o3能通过模糊图片识别出《绝命毒师》角色"炸鸡叔"Gus Fring [46][52] - 模型在数手指个数和判断时钟时间等视觉推理任务上仍存在系统性错误 [69][70][72] 定价与市场竞争 - o3定价为$10/Mtok输入和$40/Mtok输出,是旗舰模型中最贵的 [77][80] - o4-mini定价为o3的1/10,比Claude 3.7更便宜 [78][80] - Gemini 2.5 Pro和DeepSeek-V3等模型在性价比上更具优势 [80] - 行业认为所有一线模型定价可视为在同一水平竞争,Gemini和OpenAI相对便宜 [77][79] 技术发展与未来方向 - OpenAI发现RL Scaling呈现"more compute = better performance"规律,o3投入算力比o1高一个数量级 [81][82] - 强化学习教父提出Era of Experience概念,认为agent需从experience中学习达到superhuman水平 [85][86] - 未来agent可能发展出非人类思维方式的推理,如符号化、分布式或可微分计算 [89] - 构建"world model"预测动作对环境的影响将成为重要发展方向 [89]
Meta推出独立AI应用,指向AI社交方向
Founder Park· 2025-04-30 17:50
Meta AI独立应用发布 - Meta在LlamaCon开发者大会上正式发布独立AI助手应用Meta AI 区别于此前嵌入在Instagram Facebook等应用中的AI功能[1] - 公司CEO马克·扎克伯格预计2025年Meta AI将覆盖超10亿人 目标成为领先AI助手 直接对标ChatGPT 谷歌Gemini和xAI的Grok[1] 产品核心差异化 - 创新性引入Discover feed社交功能 用户可浏览好友与AI互动生成的内容流 并进行点赞 评论 分享或二次创作[6] - 该功能基于Meta社交应用帝国基因 旨在直观展示AI应用价值 是首个将社交元素引入AI助手的科技公司[2][9] - 语音交互采用full-duplex模型技术 实现自然对话体验 支持快速轮换对话和语音重叠 已在美加澳新上线[10] 技术整合与战略布局 - 应用基于自主优化的Llama 4模型运行 整合Facebook Instagram用户数据提供个性化回应[13] - 替代原有Ray-Ban智能眼镜配套应用View 实现AI技术与硬件产品协同 新版本保留眼镜照片视频库功能[14][16] - 高端智能眼镜将配备小型显示屏 新增实时物体识别和语言翻译功能 计划2024年晚些时候推出[16] 行业趋势观察 - AI聊天机器人与社交媒体融合成新趋势 X平台已整合Grok OpenAI正筹划为ChatGPT添加社交feed功能[9] - 当前Meta AI通过嵌入式入口触达近十亿用户 但独立应用被视为更直观的交互方式[13]
来自flomo、沉浸式翻译、Cubox、Podwise、Fellou、Manus的劳动节礼物
Founder Park· 2025-04-30 17:14
AI产品市集计划概述 - 公司推出「AI产品市集」计划,首期推荐10款创新AI产品 [2] - 计划发布24小时内飞书群突破1000人,持续增长中 [3] - 社群每日推荐AI产品并分享真实使用反馈 [3] 社群福利活动 - 五一期间推出6天进群福利,包括51个flomo会员、41个沉浸式翻译会员等 [5] 计划背景与目标 - 观察到DeepSeek崛起、Manus爆火等信号,预示AI产品春天来临 [7] - 计划旨在记录开发者成果,帮助创新AI产品获得行业关注 [7] 计划服务内容 - 提供早期市场验证服务,通过社区反馈优化产品 [8] - 为优秀产品提供展示推广服务,利用公众号及社群扩大声量 [9] 参与产品标准 - 涵盖早期产品(用户量未达10万)及多样化形态(移动端、Web端等) [10][11] - 无严格限制,鼓励提交产品demo申请助推 [12] 相关行业动态 - 提及Qwen 3发布、Perplexity浏览器竞争等AI行业热点 [13]
AI 活动公告板:5 月假期,来充电!
Founder Park· 2025-04-29 20:33
AI行业活动概览 - 阿里开源Qwen3系列模型并推出Fellou、扣子空间、心响等AI Agent产品,行业创新速度加快 [2] - 参与高质量行业活动是快速跟进AI趋势的重要途径 [2] 重点活动详情 湾区闭门深度交流局 - 主办方为极客公园Global ready,5月17日-19日在湾区举办,与Figma大会、SaaStr 2025、Google I/O同期 [4][5] - 目标人群为企业家、AI创业者及关键业务负责人,需通过微信联系报名 [4][6] 亚马逊云科技AI开发大赛 - 线上活动,4月10日-6月19日举行,提供10万启动金、拉斯维加斯技术之旅及禅意机械键盘等奖励 [6] - 面向AI创业者及开发者,强调代码全民化与创新边界突破 [6] NVIDIA创业企业展示-上海站 - 5月15日线下举办,聚焦AI智能体、合成数据、物理仿真,提供技术指导、资金支持及产业对接 [6] - 目标人群为AI创业者、开发者及技术专家 [6] Hugging Face AI Agents课程 - 长期线上课程,教授Agents底层原理及smolagents、LlamaIndex等工具库的应用 [7] - 适合AI工程师、创业者及产品经理 [7] 复星杯AI+创业创新大赛 - 6月1日截止报名,依托复星200+产业场景,提供千万级投资、出海资源及亚马逊补贴 [7][8] - 面向AI创业者及开发者,优胜者可获现金奖及复星直通录用机会 [7][8] 延伸阅读 - 文章推荐Perplexity浏览器战略、Arc创始人访谈及OpenAI Agent产品化分析等话题 [9]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 20:33
阿里Qwen 3大模型发布 - Qwen3-235B-A22B评测成绩与DeepSeek R1、Grok-3、Gemini-2.5-Pro相当,支持混合推理和增强Agent能力 [1] - 全系列模型实现全参数(0.6B-235B)和全模态覆盖,成为HuggingFace最受欢迎开源模型,衍生模型数量突破10万超越Llama系列 [16][17][23] - 采用"思考模式/非思考模式"无缝切换技术,优化MCP工具调用成功率,官方明确从"训练模型"转向"训练Agent"的战略方向 [5][6][7] 中国开源模型全球竞争格局 - DeepSeek+Qwen形成开源"双子星"格局,取代Llama+Mistral成为全球主流开源生态 [1][13] - 开源策略突破地缘政治壁垒:模型权重和训练细节全公开,开发者可自托管定制,建立全球开发者社区信任 [10][12][15] - 两种差异化商业模式:DeepSeek通过技术突破提供低价API服务(成本降低80%),Qwen通过开源带动阿里云商业闭环 [19][20][21] MaaS模式创新 - 阿里云构建"模型-云-行业应用"飞轮:Qwen开源降低AI创业门槛,百炼平台提供MCP服务接入 [2][24] - 实际案例显示Claude+Qwen2.5组合成为创业公司主流方案,混合使用闭源与开源模型平衡成本能力 [25][27][30] - 行业专用模型在医疗、金融等高壁垒领域仍具优势,但需结合本地化服务和数据闭环 [14] AI创业者实践洞察 - 模型选择策略:ToB企业倾向Qwen32B微调(单卡可部署),ToC企业采用API组合(Gemini+DeepSeek) [27][45] - 四大核心挑战:长文本处理衰减(播客场景)、多模态情感理解(心理场景)、国产芯片适配(机器人场景)、并发稳定性(服务场景) [36][40][41] - 创业方法论验证:70%成功案例遵循"X+AI"而非"AI+X"模式,留存率取决于真实需求解决而非技术指标 [48][50] 开源模型技术趋势 - 能力差距持续存在但应用门槛降低:2025年开源模型已满足PMF验证需求,微调价值向窄领域迁移 [25][43] - 三大技术方向:混合推理架构(成本控制)、Agent工具调用(实用化)、多模态融合(场景适配) [5][7][23] - 社区驱动创新:Qwen生态含完整工具链(vLLM/SGLang),DeepSeek聚焦前沿技术(MoE/多模态) [32][49]