让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

你的位置:今日焦点 > 图片 >

    
发布日期:2024-09-20 18:54    点击次数:107

天然 OpenAI 的「Her」照旧期货,但硅谷的科技巨头们已经初始接踵发力语音模子。前有谷歌的 Gemini Live 和苹果的升级版 Siri,如今巨头亚马逊和少壮 Cerebras 也加入了这场竞争。

继 OpenAI 在 5 月发布会上展示「期货」GPT-4o 的语音功能后,「AI 语音助手」类的居品又成为了硅谷科技巨头的必争之地。紧随着 OpenAI 开辟布会的谷歌也飞快文告 ——Gemini 将推出语音聊天模式 Gemini Live。

8 月,谷歌在 Pixel 9 行径上致密发布了 Gemini Live,取代了蓝本谷歌助手的居品定位。

类似 GPT-4o,Gemini Live 不仅能兑现随时打断的对话式疏导,还有对培植屏幕的感知材干,不错及时讲明用户的屏幕或视频信息。

Gemini Live 咫尺已经针对安卓培植推出,但仍唯有英语模式,将来还将登录 iOS 系统并提供更多言语。

6 月,苹果就在 WWDC 大会上展示了奈何用 Apple Intelligence 给 2011 年就降生的 Siri 补苴罅漏。

与谷歌和 OpenAI 把稳强调的「疏导」功能不同,Siri 似乎更专注于语音「助手」的定位。屏幕感知、跨诈欺操作、智能体般的多号召处理,一个都不少。

比如,动动嘴便可绽放文档、将札记移动到另一个文献夹、发送或删除电子邮件、在 Apple News 中绽放特定著述、发送网页贯串,以致苦求培植提供著述摘录。

可是,这版更强 Siri 的上线还莫得明确期限,所依靠的 Apple Intelligence 也只可在 iPhone 15 Pro 或更新式号的手机材干运行。

字据彭博社的报说念,苹果团队似乎需要大批时刻来重构 Siri 的底层,高档版 Siri 最快也要比及 2025 年,才会出当今 iOS 18 上。

天然还未致密上线,但不错看出,GenAI 的这波调动让苹果 13 岁的 Siri 慷慨重生。

而提到 Siri,让东说念主想起和它同代的另一个语音助手 —— 亚马逊推出的 Alexa。

亚马逊更正 Alexa

现实上,Alexa 的调动缱绻由来已久。早在本年 1 月,Business Insider 就报说念过这个式样,名为 Remarkable Alexa,它正在表里的重重阻力下禁绝鼓吹。

发布的日历亦然一拖再拖,从率先的 6 月 30 日,到之前决定的 8 月。

8 月 30 日路透社报说念,有知情东说念主士示意,改进版的 Alexa 将在 10 月好意思国沐日季前发布。

该式样在里面被称为「榕树」(Banyan),将是 Alexa 自 2014 年与 Echo 系列扬声器一皆推出后迎来的初次要紧更动。

Remarkable Alexa 缱绻向用户收取 5~10 好意思元的订阅用度,以抵销 GenAI 模子的资本。

这部分订阅不会包含在每年 139 好意思元的 Prime 劳动中,但亚马逊仍将提供免费版块的 Classic 语音助手。

Alexa 难掩劣势

2014 年,亚马逊初次推出 Alexa 的语音驱动功能,让其时的破费者咋舌不已,却过期于最近的 GenAI 海浪。

字据 Insider Intelligence 的统计,在好意思国,Google Assistant 本年的用户数目瞻望将达到 8880 万,其次是 Siri 的 8420 万。Alexa 的用户数目位居第三,约为 7560 万。

和 Siri 沦为语音计时器的境地类似,通过 Echo 音响探听的 Alexa 也多用于建树计时器、盘考天气、播放音乐或回话肤浅问题等功能。

不仅如斯,亚马逊想要通过 Alexa 提高电交易务销售额的但愿也破裂了。

正如 Kindle 屏之于电子书商城,健康监测劳动之于 Halo 手环,低廉到平日低于资本价的 Echo 音响和免费提供的 Alexa,现实上包含着亚马逊借硬件打造软件的居品想路 ——

不求在硬件销售上收获,但求从用户后续对软件的使用、数字内容的获取和平台的依赖等中获取更高毛利的收入。

这种营销方式率先是模仿剃须刀巨头吉列 —— 推出极具价钱上风的剃须刀,但通过售卖补充刀片赚得盆满钵满。

率先对 Alexa 的设计相称好意思好 —— 用户通过语音方式盘考购买建议,之后委用 Alexa 径直下单,就能拉动亚马逊的电商销量。

但随后他们发现,这个想路不起作用。主若是因为用户可爱「著明不如一见」,仅凭 Alexa 的语音容貌很难让东说念主宁愿掏钱网购。

字据里面文献和知情东说念主士的领略,这种不到手的计谋让亚马逊在 Echos、Kindle 等智能培植业务上赔本了数百亿好意思元,不错说是贝索斯在位时为数未几的弘大误判。

硬件亏钱、软件不收获,力挺 Alexa 的贝索斯又离开了惩办团队,导致裁人的大刀来源落在了 Alexa 团队的头上。

Business Insider 追踪 LinkedIn 上的帖子后发现,在 2022 年底初始的大裁人中,Alexa 的 AI 系统、天然言语贯串和对话材干团队险些是首当其冲、受到了最高品级的影响。

赓续词,即使 AI 本领过期、赔本弘大,Alexa 还掌抓着一个关节上风,不错助他们扳回一城 —— 范围 2023 年,已经在巨匠卖出的扶持 Alexa 的硬件培植进步 5 亿台。

互助 Anthropic 借用 Claude

CNBC 和 Business Insider 在之前的报说念中曾征引知情东说念主士的说法,示意亚马逊缱绻基于里面言语模子 Titan 或 Olympus 升级 Alexa。

赓续词,好像是里面本领不得力,路透社的最新报说念示意,10 月发布的 Remarkable Alexa 将由 Anthropic 的 Claude 模子扶持,而非我方的基座模子。

亚马逊和 Anthropic 的互助由来已久。客岁 9 月,他们就为 Anthropic 提供了高达 40 亿好意思元的投资,取得少许股权的同期,以 AWS 云劳动交换到了对 Claude 模子的使用。

一些知情东说念主士示意,升级后的 Remarkable Alexa 不错履行更复杂的任务,举例撰写不祥的电子邮件、发送邮件以及从 Uber Eats 订餐,况且让用户无需在对话中类似召唤「Alexa」。

此外,亚马逊还缱绻增强 Alexa 提供的自动化家居功能,不错无线趋奉到智能培植,让用户进行语音范围。

具体而言,Remarkable 的关节功能更新如下:

对话材干增强,与用户进行更天然、更有劝诱力的对话,并提供与高下文赓续的反馈

个性化保举:字据用户喜好和历史纪录,针对购物、新闻和其他内容进行定制化保举

家居自动化:Remarkable Alexa 将当作一个更复杂的家居自动化中心,记着用户偏好,自动履行闹钟建树、咖啡机启动或电视节目次制等任务

复杂任务履行:用户不错提议更复杂的教导,举例订购食品或草拟电子邮件

一言以蔽之,濒临谷歌、苹果等公司来势汹汹的竞争,Alexa 团队当今的任务是,打造一款能够在新的 GenAI 竞争中脱颖而出的语音交互培植。

这其中的阻塞,一是价钱,二是 AI 安全问题。一位知情东说念主士推断,在 Alexa 中使用 GenAI 的查询资本为每次 2 好意思分。有里面推断以致指出,订阅用度需要定为 20 好意思元,这亦然 ChatGPT 的订阅价钱。

也有亚马逊职工示意怀疑,除了已经为 Prime 会员支付 139 好意思元的用户,是否还有东说念主爽快每年多掏 60~120 好意思元,取得比免费版 Alexa 更智能一丝的 Remarkable Alexa。

但好意思国银行分析师 Justin Post 的分析恶果杰出乐不雅。

字据他在 6 月的推断,约莫有 1 亿活跃的 Alexa 用户,其中 10% 可能会接收 Alexa 的付费版块。按每月 5 好意思元的用度诡计,这将独特带来 6 亿好意思元的年销售额。

AI 安全方面,有开辟东说念主员示意,Alexa 大多出当今客厅或厨房中,这提高了诈欺 GenAI 模子的风险。如果 Alexa 不睬解号召或提供不成靠的信息,犯作假的代价就会更高。

Cerebras 语音版成 GPT-4o 平替

想跟上语音模子更新设施的,除了亚马逊这种巨头,还有 Cerebras 这个少壮。

前几天刚发布了堪称巨匠最快的 AI 推理架构 ——Cerebras Inference 的 AI 初创芯片公司 Cerebras,也基于 livekit.io 平台构建了我方的语音模子。

据悉,Cerebras Inference 使用了 Cerebras CS-3 系统和 WSE-3 AI 处理器,内存带宽和内核数分离是英伟达 H100 的 7,000 倍和 52 倍。

依托具备如斯超高速 AI 推理材干的 Cerebras Inference 之上的 Cerebras 语音对话模子让东说念主相称期待!

▲ demo 贯串:https://livekit.io/ kitt▲ demo 贯串:https://livekit.io/ kitt

但原始的视频 demo 贯串已失效。多亏考虑区眷注网友,提供了另外一个类似于 Cerebras 语音对话模式的示例。

该对话模拟示例一样基于 LiveKit,但以 ChatGPT 为基础模子。

具体来说,它借助 Websocket 使用 LLM 模拟了电话对话,并进行了系列优化,最终兑现了无缝和快速对话。

不少网友在颂赞其功能强盛,开辟方便的同期,惘然它比 ChatGPT-4o 上线晚,丢失了很大一部分热度。

LiveKit 代理是通过语音,视频和数据频说念与最终用户相互作用的多模式 AI 智能体 Agent 的端到端框架。该框架不错凭借 Python 构建智能体。

Agent 框架被设计成可构建及时、可编程、运行在劳动器上的框架。它可被用来创建可看到的、听到、贯串的对话和多模态语音智能体。

该框架包括用于常见责任过程的插件,举例语音行径检测和语音到文本调遣。

Agent 与云或自托管 LiveKit 劳动器无缝集成,在腹地诡计机上开辟的 Agent 代码不错彭胀以扶持千千万万的并发会话,然后将其部署到劳动器中。

仓库地址:https://github.com/ livekit / agents仓库地址:https://github.com/ livekit / agents

Cerebras 语音版依然发布,就激励了油管上好多博主的关注和测评。

Antti Luode 通过屡次打断对话的方式,测试了 Cerebras 及时语音模式的材干,说明其能快速灵验贯串对话并提供可靠信息。

Cerebras 语音版 Q&A 对话集锦

Q:你是奈何被开辟的?

A:我是天然言语处理和机器学习算法的组合产物。我不错兑现交互,在用户打断我时,也允许无缝调遣和天然的对话过程。

Q:你有什么想对 YouTube 不雅众说的吗?

A:我仅仅开启了对话型 AI 本领套件的新纪元。诸如我一样的语音助手将来,需格局有更复杂、更东说念主性化的功能。比如能贯串轻捷高下文间的差距,以致情谊的变化。

Q:我的临了一个问题,奈何绽放启动舱门?

A:短语「绽放启动舱门」,是电影《2001 年天外漫游》中的一句著明台词,由 Dave Bowman 在尝试与飞船诡计机交互时说出...

令东说念主惊喜的是,这场跨时空的伪善对话,预示着东说念主工智能期间,超灵敏电脑 HAL 9000 的现实体正一步步向咱们走来!

参考府上:

https://www.reuters.com/technology/artificial-intelligence/amazon-turns-anthropics-claude-alexa-ai-revamp-2024-08-30/

https://www.cnbc.com/2024/05/22/amazon-plans-to-give-alexa-an-ai-overhaul-monthly-subscription-price.html

https://www.businessinsider.com/amazon-paid-alexa-plus-service-issues-2024-1

https://cerebras.vercel.app/

告白声明:文内含有的对外跳转贯串(包括不限于超贯串、二维码、口令等款式),用于传递更多信息,简单甄选时刻,恶果仅供参考,IT之家统统著述均包含本声明。

  声明:新浪网独家稿件,未经授权阻碍转载。 -->

  
友情链接:

Powered by 今日焦点 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024