主页 > 星空新闻 > 媒体通稿

苹果Siri的AI冲破:从语音助手酿成智能体

苹果Siri的AI冲破:从语音助手酿成智能体(图1)

  2024年6月11日,苹果(AAPL。 NASDAQ)正在线苹果环球开采者大会上宣告了全新升级的人工智能(AI)助手Siri。苹果公司首席履行官蒂姆库克正在会上宣传,新版Siri不只可能履行职分、体会上下文,还可能挪用App并与其深度交互。

  依据苹果宣告会,新版Siri的文本转语音效用过程改良,使得其声响听起来更自然、更逼近人类的语音;新版Siri将具备“屏幕感知”效用,可能体会用户正正在浏览的实质,并针对合联App供应操作发起;其余,新版Siri可能更深切地与第三方App集成,履行如翻开操纵、体播放等操作。

  正在对Siri的AI效用实行升级除外,苹果还告示与OpenAI配合,将ChatGPT集成到其操作编制中,同意用户免费探访GPT-4o的某些效用,并为订阅用户供应更深切的本性化办事。

  商汤科技(智能财产钻探院院长田丰对记者称,新版Siri是人工智能演进到更高阶段智能体的一个呈现。田丰说,从技能上看,人工智能依然从简单的大讲话模子迈向了众模态大模子,最终又演进到了智能体阶段。可是,光有智能体技能是不敷的,还须要将技能嵌入到海量终端筑造和App中以竣工其效用。苹果与OpenAI等AI技能供应商配合,可能充斥阐发苹果的海量用户和App生态上风。新版Siri正在海量终端用户和大周围的第三方App的挪用中,将阐发AI的更大操纵潜力。

  田丰说,当一个学会这几样本领的智能体被植入用户的手机里,用户无须再去寻找,以至连App都不须要翻开了。比如,智能体可能举动手机上的助手,助助用户实行平素职分,如删改文档、天生叙述、寻找新闻等。比如,手机上的助手可能处置文本新闻,并助助用户正在搬动筑造上竣工职分,如删改文档或天生叙述。

  正在田丰看来,智能体技能依然入手贸易化并进入墟市,许众家公司依然推出了智能体产物,这意味着用户可能更众地将这些技能视为助手或器材,而不是专业的术语。

  清华大学计划机系副教学刘知远对经济考察网说:“技能上看,人工智能正迈入智能体时期。”

  刘知远称,智能体代外了人工智能规模的一个新阶段,它们不只可能处置和体会众品种型的数据,还可能正在可靠全邦中履行庞大的职分,具备进修和自我改良的才略。智能体技能是大模子技能的演进劳绩,不只秉承了大模子的才略,还引入了更富厚的效用和更高的技能门槛。与大模子比拟,智能体的技能更庞大,操纵潜力也更大。

  斯坦福大学计划机科学系教学吴恩达指出,智能体通过四大本领竣工了这一奔腾:起首,反思(Reflection)同意智能体评估本身行动并实行调度,师法了人类竣工职分后的自我反省;其次,器材应用(Tool Use)使智能体可能使用寻找、计划等各类器材来辅助职分履行;再次,计议(Planning)才略让智能体可能将大职分细分并有序履行,近似于人类写作前的提纲绸缪;最终,众智能体协同(Multi-agent collaboration)使得智能体能正在团队中互助,每个成员都有本身的脚色和职分,合伙寻找最佳治理计划。

  以OpenAI为首的诸众科技公司,正将智能体技能举动其焦点政策。正在2023年11月6日的OpenAI开采者大会上,OpenAI创始人Sam Altman夸大了智能体及合联生态修建的紧急性。

  OpenAI于2023年3月14日宣告了GPT-4,这是一款可能处置众模态输入的大型讲话模子。GPT-4更新了All Tools效用,该效用同意模子正在一个对话中挪用众个器材竣工庞大指令。

  Sam Altman流露:“助助用户和开采者更好地修建智能体并为其寻找贸易形式依然成为OpenAI目前的紧急就业。”比如,正在GPTs操纵商铺内,OpenAI怒放出技能让用户和开采者可能定制和贸易化宣告本身的智能体。

  “假若大模子是唆使机,智能体便是整辆车。”田丰以为,众模态大模子将差异的模态集成正在一齐,使得AI可能更周全地体会和响操纵户的需求。智能体可能竣工情况感知、职分分化、持久回想和自我改良等庞大效用,可能挪用众个软件器材或模子来竣工庞大的职分。

  体贴硬科技规模,网罗呆板人及人工智能、无人机、虚拟实际(VR/AR)、智能穿着,以及新原料规模。擅长企业深度报道及上市公司理会报道。挖掘前沿技能、兴盛趋向投资价钱。订阅

×

扫一扫关注 集团官方微信