MWC 2024 で、クアルコムは Android スマートフォン向けの生成 AI における最新の進歩を披露しました。そして、それらは本当に印象的です。
https://tech-trend.work/%E3%82%AF%E3%82%A2%E3%83%AB%E3%82%B3%E3%83%A0%E3%81%AF%E3%80%81%E3%81%93%E3%82%8C%E3%82%89%E3%81%AE%E3%82%AF%E3%83%AC%E3%82%A4%E3%82%B8%E3%83%BC%E3%81%AA%20AI%20%E3%83%84%E3%83%BC%E3%83%AB%E3%82%92/
で、クアルコムは、Android フォン用の Snapdragon シリーズ シリコンによって促進される、AI オンフォン トリックのポートフォリオにさらなる追加を行っています。このチップメーカーは、音声起動メディア編集、安定拡散を使用したデバイス上画像生成、Meta などの大規模な言語モデル上に構築されたよりスマートな仮想アシスタントなど、 Snapdragon 8 Gen 3 フラッグシップ向けのいくつかの印象的な AI 機能をすでに披露しています。
現在、同社はこれらの AI 超大国に対してさらなる不満を加えています。 1 つ目は、 スマートフォン 上で Large Language and Vision Assistant (LLaVa) を実行できる機能です。これは 、Google レンズの機能が付与された ChatGPT のようなチャットボットと考えてください。そのため、クアルコムのソリューションはテキスト入力を受け入れるだけでなく、画像を処理することもできます。
たとえば、豚肉のボードを描いた画像をプッシュし、それに基づいて質問することができます。 AI アシスタントは、70 億を超えるパラメーターを処理できる大規模マルチモーダル モデル (LMM) に基づいており、以下の入力画像に示されているボード上のあらゆる種類の果物、チーズ、肉、ナッツを教えてくれます。
後続のクエリも処理できるため、流れるようなやり取りを行うことができます。現在、ChatGPT などもマルチモーダル機能を獲得しています。これは、OpenAI のツールが画像入力も処理できることを意味します。ただし、決定的な違いがあります。