Grok 新口号:只管 Grok 它
只管 GROK 它
今日 AI 热点一览 · 数据来自 AI HOT
只管 GROK 它
WSJ 报道,OpenAI 正考虑大幅降价以应对与 Anthropic 的竞争。Anthropic 增长主要来自开发者和编码工作流,Claude Code 消耗大量 token,已让企业团队将其融入日常工作。OpenAI 虽在消费品牌上更大
M3 现已上线 @RespanAI 🔥 并且享五折优惠
Perplexity Deep Research 现以原生技能形式集成至 Perplexity Computer 平台。Computer 负责将复杂问题分解为子任务,路由至20多个前沿模型,并返回报告、演示文稿和仪表板。Deep Resea
Claude Fable 5 到目前为止感觉不错,但我还不认为它相比 GPT-5.5 或 Opus 4.8 有巨大飞跃。 我最大的不满:旧的AI研究论文/博客 + 基本问题常常触发自动降级到 Opus 4.8。 Anthropic 昨晚表示
Ideogram 4.0 是 Ideogram 首个开源权重模型,生成 2K×2K 输出,支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示,提示增强器仅限 Ideogram 专有 API。在 Artificial A
Anthropic与IT服务公司DXC Technology达成多年全球联盟。DXC将培训数万名获得Claude认证的前沿部署工程师(FDE),将Claude引入其为全球大型银行、航空公司、保险公司及政府机构运营的关键系统。内部部署中,Cl
Dolci数据集中有一类特定粉丝小说,角色在池塘放屁导致鱼被熏死。数据集通过选择生动描写的回答、拒绝不配合的回答,教会模型服从。Nathan Lambert表示乐于创造此类研究场景。
靴子系好,球网架起,时钟归零--所有的小准备汇聚成足球最大的夏天。 准备好开球了吗? - 图像由 ERNIE-Image 创建
埃隆·马斯克旗下 xAI 公司的一名前人工智能工程师提起诉讼,指控公司因他对 Grok 聊天机器人的安全性提出担忧而将其错误解雇。
随着用户和企业赋予 AI 模型与智能体更高自主权,其输入输出护栏的重要性持续上升。Artificial Analysis 与 NVIDIA 合作,在三个开放数据集上独立基准测试了护栏与审核模型,评估检测质量、延迟以及在捕获不安全内容与过度拒
OpenCode Go 正在成为哪些模型被使用、如何使用的最佳数据来源。 我们制作了一个公开统计页面,供你查看最新数据。 https://opencode.ai/data
OpenAI 研究员 Noam Brown 表示,GPT-5.5 在 Agents' Last Exam(ALE)基准中排名第一,且按模型 token、成本或墙钟时间衡量同样表现最佳。ALE 由 @dawnsongtweets 团队创建,是
用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fabl
Anthropic 公开致歉,承认其 Claude Fable 功能中存在用户无法察觉的安全防护措施,但未公布具体措施细节。
推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑--选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,
DeepSeek-R1 的开源复现项目已在 GitHub 发布,在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。
两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点
Grok 是最真实的
有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
AI 智能体很强大,但它们不记得你的偏好。 所以你总是重复指令--如何组织项目、你的品牌指南。 现在你可以通过自定义指令和技能让 Replit Agent 学会你的惯例。 它会在每个项目中自动将这些考虑进去。
Grok Build 插件市场现已进入 Beta 阶段。您可以在终端中使用 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools 插件进行开发。详情请见 https://x.ai/news/g
即时配送公司 Gopuff 基于 xAI 的模型构建了新的 AI 购物助手。联合 CEO Rafael Ilishayev 表示,选择 xAI 主要是因为其成本和性能优势。xAI 正筹备 IPO,认为企业 AI 市场空间达 26 万亿美元,
Roborock Q10 S5 Plus 扫拖一体机器人价格腰斩,降至历史最低。该机型配备 AI 智能避障和强力振动拖地功能。
我们正在将 Deep Research 作为原生技能集成到 Computer 中。 它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。
Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。
一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步--通过提示词分析性能和管理数据库
@MongoDB 插件已在 Grok Build 插件市场上线。 通过单个提示词,探索数据、优化数据库性能并构建高性能向量搜索系统。
Deezer 推出了一款工具,能够扫描 Spotify、Apple Music 及其他平台的播放列表,识别其中由 AI 生成的音乐。
终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。 附带一个 API,可随时间查询你所有的数据 📊
欢迎 @ona_hq 加入团队,帮助组织在生产环境中安全部署智能体!
据《新科学家》6月10日报道,全自主无人机首次击毙了人类士兵。这是有记录以来第一次由完全自主运行的无人机执行致命攻击,标志着自主武器系统在实战中的新进展。该报道来自《新科学家》网站,目前尚无更多细节公布。
GPU 机架达到 400kW?传统数据中心无法应对,电网将被限流。 Radiant 耗时 12 个月,从零到 AI 生产,正是因为绕过了电网。基础设施主管 Patrick Wohlschlegel 告诉 @JordanNanos
一年多前我见到了@jolandgraf等人、@humford和Sandeep,现在更兴奋很快就能在办公室见到他们! https://openai.com/index/openai-to-acquire-ona/
Anthropic 目前营收超过任何其他 AI 模型公司,却仍无法靠自身获得新数据中心的融资。《The Information》报道称,贷款机构要求 Google 先担保租赁付款。正是这家 Google,协助设计 Anthropic 的芯片
Seven Seven Six 创始人兼 Reddit 联合创始人 Alexis Ohanian 在柏林 SuperReturn 年会上表示,SpaceX 的 IPO 将成为里程碑事件,为太空经济注入新资本。他还谈到即将到来的 AI 公司
单个数据中心的计算能力记录每 7 个月翻倍一次。 Colossus 1、Anthropic-Amazon New Carlisle 和 Meta Prometheus 依次登顶。
彭博观点专栏作家Gautam Mukunda指出,高管们正强迫员工使用AI,将裁员归咎于AI,并误解颠覆性技术的实际演变方式。
DigitalBridge CEO Marc Ganzi 在 Bloomberg Open Interest 节目中表示,AI 的下一个瓶颈是电力,而非仅芯片或数据中心。他阐述了公司对 ArcLight 的收购以及庞大的千兆瓦级项目管道,并
2026 年 Runway AI Festival 纽约首映门票已售罄,今晚举行。电影院见。
Jeff Bezos的AI初创公司Prometheus以410亿美元估值完成120亿美元融资轮。该公司去年11月成立时已获得62亿美元种子轮融资。目前尚未发布任何产品,Bezos表示分享细节"为时过早"。
Jeff Bezos 领导的 AI 初创公司 Prometheus 完成新一轮融资,估值达到 410 亿美元。这笔融资进一步巩固了这位亚马逊创始人在 AI 热潮中的关键地位。
我与 @ymatias(Google Research 负责人)关于 AI 如何加速科学进步的魔力循环、改善全球真实人们的生活,以及我们正进入研究黄金时代的对话。 这次交谈让我真切地感到振奋 : )
一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理
数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含"鱼放屁同人小说"等
Zed 开发者在其官方博客中提出,软件真正的创造过程并不在代码提交本身,而是发生在两次提交之间的思考、调试与重构中。这一观点强调提交记录之外的隐式工作对软件质量的决定性作用。
Ethan Mollick测试Fable模型完成柯勒律治未竟诗作《忽必烈汗》,基于PorlockBench任务:假设"波洛克的人"未出现,补全诗歌并延续主题。Fable用时10分钟思考,思维痕迹充满对柯勒律治意图的复杂分析,但结果仍显直白,
食品配送公司 Gopuff 联合 CEO Rafael Ilishayev 表示,SpaceX 派工程师帮助该公司开发了一款 AI 智能体,其价格低于竞争对手。