01 全球首款Transformer专用AI芯片Sohu发布:比英伟达H100快20倍
6月26日消息,据媒体报道,美国新兴的芯片创业公司Etched发布其首款AI芯片——Sohu。
这款芯片在运行大型模型时展现出了惊人的性能,其速度超越了行业巨头英伟达的H100高达20倍,即便是与今年3月才面世的顶尖芯片B200相比,Sohu也展现出超过10倍的优越性能。
Sohu芯片的最大突破在于它直接将Transformer架构嵌入芯片内部。据Etched公司负责人Uberti透露,Sohu采用了台积电的先进4纳米工艺制造,不仅在推理性能上远超GPU和其他通用人工智能芯片,更在能耗控制上达到了新的高度。
对于Transformer技术而言,Sohu无疑是目前市场上最快的芯片,其性能与其他产品之间存在显著的量级差异。值得一提的是,当前主流的AI产品如ChatGPT、Claude、Gemini和Sora等,均基于Transformer架构驱动。
作为世界上首款Transformer ASIC(应用型专用集成电路)芯片,Sohu的集成应用更是令人瞩目。据测试,一台配备8块Sohu芯片的服务器,其性能足以媲美160块H100 GPU的集群。具体而言,集成8块Sohu芯片的服务器每秒能够处理高达50万的Llama 7B tokens,这一数据在业界堪称前所未有。
而打造这款杰出芯片的Etched公司,位于美国加州的库比蒂诺,尽管成立仅两年,团队规模也仅有35人,但其创始人——哈佛辍学生Gavin Uberti(前OctoML和前Xnor.ai员工)和Chris Zhu,与资深技术专家Robert Wachen和前赛普拉斯半导体公司首席技术官Mark Ross共同领导,已经成功研发出这款专为大模型AI设计的芯片,展现了其强大的技术实力和无限潜力。(来源:快科技)
02 三星回应晶圆代工厂出现生产缺陷:毫无根据
6 月 27 日消息,三星昨日(6 月 26 日)发布声明,否认“三星代工业务 3nm 晶圆缺陷”的报道,认为这则传闻“毫无根据”。
此前韩国 Nate 报道称,三星电子国内(指韩国)代工事业部在半导体晶圆生产过程中出现了生产缺陷。韩国财界和证券界传出消息称,三星电子代工晶圆制造工厂在第二代 3 纳米工艺中发生了 2500 批次规模的缺陷,导致 1 万亿韩元(当前约 52.31 亿元人民币)的损失,这些晶圆必须全部废弃。而 2500 批次的生产规模相当于每月生产约 6.5 万片 12 英寸晶圆。
韩国《朝鲜日报》报道称,三星电子代工晶圆制造工厂发生了影响质量的缺陷(affect),因此影响了良品率,受损规模约为 50 片晶圆,这样的规模在公司内部事故应对分类中属于“D 级事故”,并非重大事故。
今天三星电子否认了有关其晶圆厂出现生产缺陷的报道,回应称这些报道“毫无根据”。
据此前媒体报道,消息称三星因 3nm 量产良率和能效存在问题,痛失谷歌和高通两家公司订单。此外三星 Exynos 2500 芯片良率目前不足 20%,能否用于 Galaxy S25 手机尚不明朗。(来源:IT之家)
03 OpenAI断供中国API服务 多家国产大模型厂商迅速上线“平替”方案
OpenAI在周二(6月25日)凌晨明确,将从7月9日起停止其不支持的国家和地区的API使用,OpenAI的API支持161个国家和地区,不含中国大陆和中国香港,这意味着中国在禁用之列。今日下午,多家国内大模型厂商立刻上线了相应的“搬家”方案。
智谱AI是第一个明确表示面向OpenAI API用户提供特别搬家计划的厂商。具体服务包括为开发者提供1.5亿Token(5000万GLM-4+1亿GLM-4-Air);从OpenAI到GLM的系列迁移培训。针对高用量客户则提供与OpenAI使用规模对等的Token赠送计划(不设上限);与OpenAI对等的并发规模;匹配高等级会员政策;专属“搬家”顾问及5人天技术专家支持;备案培训和辅助。
零一万物方面则告诉《科创板日报》记者,已发起“Yi API二折平替计划”,目前注册使用Yi API的新客户,零一万物立即赠送100元额度,帮助用户完成平稳过渡;平台充值还将赠送50%到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受RPM/TPM限速直升Tier3,直达高级别的服务质量和超快响应速度;此外,零一万物API还将提供Prompt兼容调优服务支持,适配Yi系列大模型。对于原先使用 GPT-4 Turbo 的用户,零一万物也给出了平滑迁移至Yi-Large-Turbo的方案,使用成本可下降九成以上。
阿里云方面称,将为OpenAI API用户提供最具性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务。
百度方面则是百度智能云千帆推出大模型普惠计划,即日起为新注册企业用户提供0元调用服务:文心旗舰模型首次免费,赠送ERNIE3.5旗舰模型5000万Tokens包,主力模型ERNIE Speed/ERNIE Lite和轻量模型ERNIE Tiny持续免费 ;针对OpenAI迁移用户额外赠送与OpenAI使用规模对等的ERNIE3.5旗舰模型Tokens包。同时,该计划还支持0元训练:免费模型精调训练服务;0元迁移:零成本SDK迁移工具;0元服务:专家服务(迁移&使用指导)。(来源:财联社)
04 全球手机OLED面板出货量首超LCD!
6月27日消息,根据研究机构Omdia最新发布的报告,2024年第一季度,全球智能手机OLED面板出货量历史上首次超过了LCD液晶屏。
报告显示,2023年智能手机显示屏年出货量达到14.5亿片,同比增长5%,而到了2024年上半年,预计出货量将达到7.15亿片,同比增长9%。其中,AMOLED屏幕出货量在2024年第一季度增至1.82亿片,同比增长39%,相比之下,TFT LCD出货量降至1.72亿片,同比下降10%。
Omdia的分析师指出,中国显示面板制造商正以更具竞争力的价格向国内智能手机品牌供应高品质AMOLED显示屏,这在中高端市场迅速取代了TFT LCD。
预计在第二季度,AMOLED的市场份额将进一步增长至53%,在第三季度将扩大至56%。
此外机构还预计,iPhone 16系列的推出将大幅推动AMOLED手机屏的出货量,这将带动2024年全年AMOLED对TFT LCD的超越。
从今年起,OLED有望在智能手机显示屏市场占据主导地位,这也意味着LCD在智能手机领域的大势已去。(来源:快科技)
05 因刹车存隐患,保时捷宣布在全球召回所有 Taycan 电动汽车
6 月 27 日消息,保时捷宣布在全球范围内召回所有 Taycan 车型,原因是他们发现制动系统存在潜在问题。
此次召回的原因是制动软管可能出现破裂导致制动液泄漏,从而降低制动压力并影响制动效果。目前尚不清楚具体有多少辆 Taycan 受到此问题影响,但自 2020 年 Taycan 上市以来,保时捷在全球范围内已经售出超过 15 万辆该车型。
出现故障的车辆仪表盘上将会亮起黄色警示灯。如果车主看到此灯亮起,应该将车辆驶回经销商处检修。如果亮起的是红色警示灯,则车主应立即联系保时捷并停止使用车辆。没有亮起任何警示灯的 Taycan 车辆则可以正常驾驶。
“我们进行了一些内部质量分析,并确定在某些特殊情况下可能发生故障,”Taycan 项目经理 Kevin Giek 表示,“安全是我们的首要任务,因此我们决定对前桥的制动软管进行优化,并采用了新的设计。我们重新设计了软管的长度、制动点和运动特性,这让我们确信此类故障不会再次发生。”
保时捷将与车主取得联系,邀请他们将车辆开往经销商处更换制动软管。更换工作大约需要两个小时,并且是免费的,不会影响车辆质保。
Giek 强调,没有出现故障的 Taycan 车辆可以放心驾驶,“如果看到黄色警示灯亮起,车主应立即前往经销商处检修。但如果没有亮灯,车辆则一切正常。”(来源:IT之家)
06 华为自研!仓颉编程语言首批合作企业揭晓:中国工商银行、中国移动等
6月26日消息,华为在上周的开发者大会上正式公布了仓颉编程语言,这是历经5年自研打造的一款面向全场景智能的新一代编程语言,主打原生智能化、天生全场景、高性能、强安全。
据悉,目前华为仓颉编程语言首批合作企业已出炉,包括中国工商银行、中国移动、科蓝软件等行业头部企业。
其中,中国工商银行是金融行业首发商业落地,已经于2024年3月完成仓颉语言版短信业务系统正式投产及对客服务,实现国产编程语言在金融行业的首家商业落地,完成从芯片、操作系统、中间件、数据库到编程语言的全栈架构转型业务系统建设。
目前,工行软件开发中心已经建设出包括芯片、操作系统、中间件、数据库等软硬件的转型架构体系,编程语言的转型已纳入工行系统全栈架构转型目标研究范围。
中国移动信息技术中心作为仓颉试点的唯一运营商合作单位,成功将该语言应用到中国移动云原生领域,对中国移动磐基PaaS平台和磐舟DevSecOps进行国产化语言改造。
此外还与华为仓颉研发团队合作共建仓颉制品库,后续制品库应用将作为仓颉语言生态的基础设施在仓颉社区进行开源发布。(来源:快科技)