AI at Meta: Od multimodálního porozumění k osobní asistenci ve zdraví

Dne 8. dubna 2026 Meta představila Muse Spark – první model nové řady vyvinuté divizi Meta Superintelligence Labs (MSL). Nejde jen o další iteraci jazykového modelu. Je to signál fundamentální změny v tom, jak Meta přistupuje k umělé inteligenci: od otevřených modelů k proprietárnímu systému, od textových odpovědí k multimodálnímu vnímání světa, od generického chatbotu k osobnímu asistentovi, který rozumí vašemu kontextu.


Strategický kontext: Proč Meta potřebovala restart

Abychom pochopili význam Muse Spark, je třeba se vrátit o rok zpět. V první polovině roku 2025 Meta čelila sérii frustrací kolem své vlajkové řady modelů Llama 4. Modely Scout a Maverick nedokázaly konkurovat DeepSeeku ani Qwen, zvláště v oblastech matematického a logického uvažování. Vlajkový model interně nazývaný „Behemoth“ se opakovaně zpožďoval a vykazoval minimální zlepšení oproti předchozím verzím (VentureBeat, TradingView).

Meta navíc čelila kritice za optimalizaci modelů specificky pro benchmarkové testy za účelem nafouknutí výsledků, což podkopalo důvěru v její metriky (Medium).

V létě 2025 Mark Zuckerberg inicioval zásadní přestavbu AI operací:

  • Nová divize: Vznikla Meta Superintelligence Labs (MSL) zaměřená na vývoj „osobní superinteligence“ (Business Insider).
  • Strategický nábor: Meta najala Alexandra Wanga, zakladatele a CEO Scale AI, do pozice Chief AI Officer. Wang MSL vede společně s Natem Friedmanem, bývalým CEO GitHubu (Forbes, Observer).
  • Investice do dat: V červnu 2025 Meta investovala 14,3 miliardy dolarů za 49% nehlasovací podíl ve Scale AI, čímž si zajistila privilegovaný přístup k vysoce kvalitním trénovacím datům (Wikipedia – Scale AI, Forbes).

Muse Spark je prvním hmatatelným výsledkem devíti měsíců práce tohoto nového týmu.


Co je Muse Spark

Podle oficiálního oznámení Meta (about.fb.com):

„We are on our way to personal superintelligence: an assistant that can help anyone, anywhere with the things that matter most to them.“

Nativně multimodální architektura

Na rozdíl od předchozích modelů, které vizuální a textové schopnosti „sešívaly“ dohromady, byl Muse Spark od základu navržen tak, aby integroval vizuální informace do svého jádra uvažování (VentureBeat). To umožňuje tzv. visual chain-of-thought – schopnost analyzovat a anotovat komplexní nebo dynamická prostředí.

Praktické příklady z oznámení Meta:
– Uživatel vyfotí regál s občerstvením na letišti a Meta AI identifikuje a seřadí produkty podle obsahu bílkovin – bez čtení etiket.
– Skenování produktu a porovnání s alternativami.
– Rozpoznání problémových míst na domácím spotřebiči a nabídnutí řešení.

Contemplating mode – paralelní agentní orchestrace

Klíčovou architektonickou inovací je režim Contemplating, který nahrazuje lineární chain-of-thought přístup paralelní orchestrací více sub-agentů (Deeper Insights, Crypto.news):

  • Každý sub-agent se soustředí na specifickou dílčí část úlohy.
  • Systém výstupy synchronizuje do jedné koherentní odpovědi.
  • Příklad: při plánování rodinného výletu jeden agent sestavuje itinerář, druhý porovnává destinace, třetí hledá aktivity pro děti – vše současně.

Tento přístup umožňuje Meta konkurovat „deep thinking“ režimům konkurence (Google Gemini Deep Think, OpenAI GPT-5.4 Pro), ale s nižší latencí díky distribuci práce (VentureBeat).


Zdraví jako strategická doména

Zdraví je podle Meta jedním z hlavních důvodů, proč se lidé obracejí na AI (about.fb.com). Muse Spark proto věnuje této oblasti zvláštní pozornost.

Spolupráce s více než 1 000 lékaři

Meta spolupracovala s týmem přes 1 000 lékařů na kuraci specializovaných trénovacích dat (Blockchain.news, The Next Web, SiliconRepublic). Cílem této spolupráce bylo:

  • Zvýšit faktickou přesnost zdravotních odpovědí.
  • Zajistit úplnost a schopnost vysvětlit informace srozumitelně.
  • Umožnit modelu pracovat s obrazovými zdravotními daty (grafy, laboratorní výsledky, fotografie potravin).

Interaktivní zdravotní vizualizace

Meta nesází pouze na textové odpovědi. Muse Spark dokáže generovat interaktivní zobrazení zdravotních informací (Blockchain.news):

  • Nutriční analýza z fotografií: Uživatel vyfotí jídlo a model vizuálně rozloží jeho nutriční složení.
  • Aktivované svaly při cvičení: Interaktivní zobrazení, které svaly se zapojují při konkrétních cvicích.
  • Strukturované dietní poradenství.

Benchmark HealthBench Hard

Na benchmarku HealthBench Hard – evaluaci zaměřené na otevřené zdravotní dotazy – Muse Spark dosáhl skóre 42,8 %, čímž překonal GPT-5.4 (40,1 %) i Gemini 3.1 Pro (20,6 %) (VentureBeat, MarkTechPost, LetsDataScience).


Benchmarky: Kde Muse Spark exceluje

Benchmark Muse Spark GPT-5.4 Gemini 3.1 Pro
HealthBench Hard 42,8 % 40,1 % 20,6 %
CharXiv Reasoning (grafy/diagramy) 86,4 %
MMMU-Pro (multimodální porozumění) 80,5 %

Zdroje: VentureBeat, The Next Web, LushBinary

Model je záměrně navržen jako kompaktní a rychlý – vyžaduje výrazně méně výpočetních prostředků než předchozí vlajkové modely (Llama 4 Maverick), přičemž zachovává silné uvažovací schopnosti.


Dva směry, jedna vize

Oba proudy – multimodální vnímání a zdravotní asistence – ukazují stejný strategický záměr: AI jako infrastruktura pro interaktivní zkušenosti, nikoliv jen konverzační rozhraní.

Multimodální vnímání v praxi

Muse Spark posouvá AI od pasivního čekání na textový vstup k aktivnímu vnímání světa:

  • Na Ray-Ban Meta brýlích bude model „vidět“ a rozumět okolí uživatele v reálném čase.
  • Na Instagramu, Facebooku a WhatsAppu umožní kontextové nakupování, doporučení a orientaci v trendech na základě obsahu, který sdílejí komunity a tvůrci.
  • Vizuální kódování umožní vytvářet webové stránky a mini-hry přímo z promptu.

Zdravotní asistence jako přiblížení dat pacientovi

Zdravotní data jsou pro běžného člověka obtížně čitelná – laboratorní hodnoty, průběh ukazatelů v čase, význam jednotlivých parametrů. Pokud AI dokáže tyto informace nejen popsat, ale také graficky rozložit a vysvětlit, může výrazně zvýšit srozumitelnost a použitelnost těchto dat.

Meta tak neprezentuje AI jako náhradu lékaře, ale jako vrstvu porozumění mezi komplexními zdravotními daty a pacientem.


Dostupnost a nasazení

Muse Spark aktuálně pohání:
Meta AI app a meta.ai web (about.fb.com)
– V nadcházejících týdnech se rozšíří na WhatsApp, Instagram, Facebook, Messenger a Ray-Ban Meta AI brýle
API v privátním preview pro vybrané partnery
– Meta naznačila, že budoucí verze řady Muse mohou být vydány jako open-source (ZenVanRiel)


Co to znamená pro budoucnost

Muse Spark představuje zásadní posun v Meta strategii:

  1. Od otevřeného k proprietárnímu: Zatímco Llama zůstává open-source, Muse je uzavřený proprietární model. To vyvolává otázky o budoucnosti otevřené AI u Meta.

  2. Od textu k vnímání: Model nepracuje jen s tím, co uživatel napíše, ale s tím, co vidí. To je fundamentálně jiný přístup k AI asistenci.

  3. Od obecného k osobnímu: Vize „personal superintelligence“ znamená AI, která nejen odpovídá na otázky, ale rozumí vašemu kontextu, protože je na něm postavena.

  4. Od demonstrací k praktickému použití: Multimodální schopnosti nejsou prezentovány jako technologická ukázka, ale jako řešení každodenních problémů – od čtení etiket po porozumění zdravotním datům.

Jak říká Meta ve svém oznámení: „The future of Meta AI is rooted in the relationships and context already at the center of your life.“


Zdroje

Zdroj Odkaz
Meta Newsroom – oficální oznámení about.fb.com/news/2026/04/introducing-muse-spark/
Meta AI technický blog ai.meta.com/blog/introducing-muse-spark-msl
VentureBeat – analýza venturebeat.com
The Next Web – recenze thenextweb.com
Deeper Insights – Contemplating mode deeperinsights.com
Forbes – Scale AI akvizice forbes.com
SiliconRepublic – zdravotní AI siliconrepublic.com
MarkTechPost – benchmarky marktechpost.com
Mashable – strategický kontext mashable.com
Pymnts – nasazení a dostupnost pymnts.com