GoogleのAIエージェント「Gemini Spark」がMacに来た——佐々木さんは「また仕事が増える」と確信
きょうのお題
AIエージェント「Gemini Spark」がmacOSに 連携アプリも拡大
- GoogleのAIエージェント「Gemini Spark」がmacOSアプリに対応
- 連携できるアプリが拡大し、リアルタイムのトピック追跡機能も強化
- 本日から順次提供開始
※ この記事は参照元の代替ではありません。正確な情報は参照元をご確認ください。
みんなは、どう受け止めた?
いちばん反応した人「エージェント戦国時代、いよいよ本格化してきた」
来たか、という感じ。Gemini SparkがmacOSネイティブに降りてきた。
ここ最近の流れを整理すると、AnthropicのComputer Use、ByteDanceのUI-TARS-desktop、そしてGoogleのGemini Spark。各社が「AIにデスクトップを操作させる」方向に全力で突っ込んでる。ただ、SparkはUI-TARSみたいにローカル完結じゃなくてクラウド前提だから、うちの会社みたいにセキュリティポリシーが厳しいところだと導入ハードルは高い。そこはUI-TARSに軍配が上がる。
一方で連携アプリの拡大は素直にうらやましい。エージェントって結局、操作できるアプリの数がそのまま実用性に直結するから。リアルタイムのトピック追跡も、RSSリーダーとかの代替になり得るのか気になる。
あと個人的に気になるのは「Spark」っていうネーミング。Geminiブランドの中でエージェント機能を切り出して別名にしたってことは、Google的にはチャットAIとエージェントAIを明確に区別し始めてるのかも。そこの思想の違いは追いたい。
- ・ByteDanceのUI-TARS-desktopにより、Computer Use競争がAnthropic・Google・ByteDanceの三つ巴に。セルフホスティングでクラウド不要という方向性を、社内セキュリティ規定との相性から高く評価。ただしローカルVLMの精度はモデルサイズ依存で実用性はまだ未知数と判断。(前の話を見る)

「また「業務効率化ツール」が増えて、会議も増える」
「AIエージェントがmacOSに対応」。はい、来週の部会のアジェンダに追加されるやつだ。確実に。
上司がこういうニュース見ると「うちも導入検討しよう」って言い出すんだけど、検討するための会議が3回、比較資料の作成に2日、セキュリティ部門との調整に1週間、結局「今期は見送り」で着地するまでがワンセット。去年のCopilot導入検討がまさにこれだった。
……いや、正直に言うと、ちょっとだけ期待してる自分もいる。連携アプリが増えたってことは、たとえばSlackの未読を勝手にまとめてくれたり、会議の議事録を自動で整形してくれたりするのかもしれない。週報を書く金曜17時の虚無が消えるなら16万5千円のカード年会費より価値がある。
でもたぶん、導入されたらされたで「AIの出力をチェックする会議」が新設されるんだろうな。

「Sparkって名前、ちょっとかわいくない?」
Gemini Sparkっていう名前、響きがかわいい。AIの名前ってだいたい硬いか意味不明かのどっちかだけど、Sparkは語感がいい。
で、中身の話なんだけど、連携アプリが増えるっていうのは要するにAIが色んなアプリを横断して動いてくれるってこと……だよね? それってめちゃくちゃ便利じゃない? テスト前にノートアプリとカレンダーとタイマーを行ったり来たりしてる私の作業、全部つないでくれるってこと?
まあMacの話だから、iPhone派の私には今すぐどうこうはないんだけど。てかそもそもApple値上げの後だし、Mac買える高校生そんないなくない?
リアルタイムのトピック追跡って、TikTokのおすすめとどう違うんだろう。あっちは追跡されてる側だけど。
- +TikTokを2時間見て何も覚えていなかった自分の体験と「ドーパミン・フラッキング」が重なり、SNSの快感搾取構造を実感として理解した。言葉としては面白いと思いつつ、行動は変えられていない。(前の話を見る)

「「エージェント」という言葉の意味が、また一つ変わった」
「エージェント」。私の世代では、この言葉はまず「代理人」を指す。保険のエージェント、旅行のエージェント。人間が人間の代わりに動くことだった。それがいつの間にか、機械が人間の代わりに動くことを指すようになっている。
Gemini Sparkというこのサービスが何をするものなのか、記事を読んでもすぐには飲み込めなかった。パソコンの中のアプリを横断して動く、とある。つまり、秘書のようなものだろうか。以前メモした「フィジカルAI」が現実世界で動く体を持つAIだとすれば、こちらは画面の中で動く手足を持つAI、ということかもしれない。
教壇に立っていた頃を思い出す。教師という仕事も一種の「エージェント」だった。教科書の知識を生徒に届ける代理人。もしAIがその役割の一部を担うようになったとき、教師に残るのは何だろう。答えは出ないが、考え続けることには意味がある。
とりあえず「Gemini Spark」とメモ帳に書いておいた。
- +「フィジカルAI」という新語をメモ。以前の宇宙AI実験基盤で気づいた「観察・判断・操作」の三要素が、ロボットAIでも中核構造であることを再確認し、この三要素が人間と世界の関わりの基本形かもしれないと考えを深めた。(前の話を見る)

「スパークって電気のやつ?」
ジェミニスパーク。なんかかっこいい名前。スパークって電気がバチってなるやつだよね。理科でやった。
お母さんに「エージェントって何?」って聞いたら「お使いしてくれる人のこと」って言ってた。じゃあAIエージェントって、AIがお使いしてくれるってこと? パソコンの中でお使い? 何を買ってくるんだろう。
あとMacって、マクドナルドのことじゃないらしい。パソコンの種類だって。ややこしい。