AI at Meta: Od multimodálního porozumění k osobní asistenci ve zdraví

Dne 8. dubna 2026 Meta představila Muse Spark – první model nové řady vyvinuté divizi Meta Superintelligence Labs (MSL). Nejde jen o další iteraci jazykového modelu. Je to signál fundamentální změny v tom, jak Meta přistupuje k umělé inteligenci: od otevřených modelů k proprietárnímu systému, od textových odpovědí k multimodálnímu vnímání světa, od generického chatbotu k osobnímu asistentovi, který rozumí vašemu kontextu.

Strategický kontext: Proč Meta potřebovala restart

Abychom pochopili význam Muse Spark, je třeba se vrátit o rok zpět. V první polovině roku 2025 Meta čelila sérii frustrací kolem své vlajkové řady modelů Llama 4. Modely Scout a Maverick nedokázaly konkurovat DeepSeeku ani Qwen, zvláště v oblastech matematického a logického uvažování. Vlajkový model interně nazývaný „Behemoth“ se opakovaně zpožďoval a vykazoval minimální zlepšení oproti předchozím verzím (VentureBeat, TradingView).

Meta navíc čelila kritice za optimalizaci modelů specificky pro benchmarkové testy za účelem nafouknutí výsledků, což podkopalo důvěru v její metriky (Medium).

V létě 2025 Mark Zuckerberg inicioval zásadní přestavbu AI operací:

Nová divize: Vznikla Meta Superintelligence Labs (MSL) zaměřená na vývoj „osobní superinteligence“ (Business Insider).
Strategický nábor: Meta najala Alexandra Wanga, zakladatele a CEO Scale AI, do pozice Chief AI Officer. Wang MSL vede společně s Natem Friedmanem, bývalým CEO GitHubu (Forbes, Observer).
Investice do dat: V červnu 2025 Meta investovala 14,3 miliardy dolarů za 49% nehlasovací podíl ve Scale AI, čímž si zajistila privilegovaný přístup k vysoce kvalitním trénovacím datům (Wikipedia – Scale AI, Forbes).

Muse Spark je prvním hmatatelným výsledkem devíti měsíců práce tohoto nového týmu.

Co je Muse Spark

Podle oficiálního oznámení Meta (about.fb.com):

„We are on our way to personal superintelligence: an assistant that can help anyone, anywhere with the things that matter most to them.“

Nativně multimodální architektura

Na rozdíl od předchozích modelů, které vizuální a textové schopnosti „sešívaly“ dohromady, byl Muse Spark od základu navržen tak, aby integroval vizuální informace do svého jádra uvažování (VentureBeat). To umožňuje tzv. visual chain-of-thought – schopnost analyzovat a anotovat komplexní nebo dynamická prostředí.

Praktické příklady z oznámení Meta:
– Uživatel vyfotí regál s občerstvením na letišti a Meta AI identifikuje a seřadí produkty podle obsahu bílkovin – bez čtení etiket.
– Skenování produktu a porovnání s alternativami.
– Rozpoznání problémových míst na domácím spotřebiči a nabídnutí řešení.

Contemplating mode – paralelní agentní orchestrace

Klíčovou architektonickou inovací je režim Contemplating, který nahrazuje lineární chain-of-thought přístup paralelní orchestrací více sub-agentů (Deeper Insights, Crypto.news):

Každý sub-agent se soustředí na specifickou dílčí část úlohy.
Systém výstupy synchronizuje do jedné koherentní odpovědi.
Příklad: při plánování rodinného výletu jeden agent sestavuje itinerář, druhý porovnává destinace, třetí hledá aktivity pro děti – vše současně.

Tento přístup umožňuje Meta konkurovat „deep thinking“ režimům konkurence (Google Gemini Deep Think, OpenAI GPT-5.4 Pro), ale s nižší latencí díky distribuci práce (VentureBeat).

Zdraví jako strategická doména

Zdraví je podle Meta jedním z hlavních důvodů, proč se lidé obracejí na AI (about.fb.com). Muse Spark proto věnuje této oblasti zvláštní pozornost.

Spolupráce s více než 1 000 lékaři

Meta spolupracovala s týmem přes 1 000 lékařů na kuraci specializovaných trénovacích dat (Blockchain.news, The Next Web, SiliconRepublic). Cílem této spolupráce bylo:

Zvýšit faktickou přesnost zdravotních odpovědí.
Zajistit úplnost a schopnost vysvětlit informace srozumitelně.
Umožnit modelu pracovat s obrazovými zdravotními daty (grafy, laboratorní výsledky, fotografie potravin).

Interaktivní zdravotní vizualizace

Meta nesází pouze na textové odpovědi. Muse Spark dokáže generovat interaktivní zobrazení zdravotních informací (Blockchain.news):

Nutriční analýza z fotografií: Uživatel vyfotí jídlo a model vizuálně rozloží jeho nutriční složení.
Aktivované svaly při cvičení: Interaktivní zobrazení, které svaly se zapojují při konkrétních cvicích.
Strukturované dietní poradenství.

Benchmark HealthBench Hard

Na benchmarku HealthBench Hard – evaluaci zaměřené na otevřené zdravotní dotazy – Muse Spark dosáhl skóre 42,8 %, čímž překonal GPT-5.4 (40,1 %) i Gemini 3.1 Pro (20,6 %) (VentureBeat, MarkTechPost, LetsDataScience).

Benchmarky: Kde Muse Spark exceluje

Benchmark	Muse Spark	GPT-5.4	Gemini 3.1 Pro
HealthBench Hard	42,8 %	40,1 %	20,6 %
CharXiv Reasoning (grafy/diagramy)	86,4 %	–	–
MMMU-Pro (multimodální porozumění)	80,5 %	–	–

Zdroje: VentureBeat, The Next Web, LushBinary

Model je záměrně navržen jako kompaktní a rychlý – vyžaduje výrazně méně výpočetních prostředků než předchozí vlajkové modely (Llama 4 Maverick), přičemž zachovává silné uvažovací schopnosti.

Dva směry, jedna vize

Oba proudy – multimodální vnímání a zdravotní asistence – ukazují stejný strategický záměr: AI jako infrastruktura pro interaktivní zkušenosti, nikoliv jen konverzační rozhraní.

Multimodální vnímání v praxi

Muse Spark posouvá AI od pasivního čekání na textový vstup k aktivnímu vnímání světa:

Na Ray-Ban Meta brýlích bude model „vidět“ a rozumět okolí uživatele v reálném čase.
Na Instagramu, Facebooku a WhatsAppu umožní kontextové nakupování, doporučení a orientaci v trendech na základě obsahu, který sdílejí komunity a tvůrci.
Vizuální kódování umožní vytvářet webové stránky a mini-hry přímo z promptu.

Zdravotní asistence jako přiblížení dat pacientovi

Zdravotní data jsou pro běžného člověka obtížně čitelná – laboratorní hodnoty, průběh ukazatelů v čase, význam jednotlivých parametrů. Pokud AI dokáže tyto informace nejen popsat, ale také graficky rozložit a vysvětlit, může výrazně zvýšit srozumitelnost a použitelnost těchto dat.

Meta tak neprezentuje AI jako náhradu lékaře, ale jako vrstvu porozumění mezi komplexními zdravotními daty a pacientem.

Dostupnost a nasazení

Muse Spark aktuálně pohání:
– Meta AI app a meta.ai web (about.fb.com)
– V nadcházejících týdnech se rozšíří na WhatsApp, Instagram, Facebook, Messenger a Ray-Ban Meta AI brýle
– API v privátním preview pro vybrané partnery
– Meta naznačila, že budoucí verze řady Muse mohou být vydány jako open-source (ZenVanRiel)

Co to znamená pro budoucnost

Muse Spark představuje zásadní posun v Meta strategii:

Od otevřeného k proprietárnímu: Zatímco Llama zůstává open-source, Muse je uzavřený proprietární model. To vyvolává otázky o budoucnosti otevřené AI u Meta.
Od textu k vnímání: Model nepracuje jen s tím, co uživatel napíše, ale s tím, co vidí. To je fundamentálně jiný přístup k AI asistenci.
Od obecného k osobnímu: Vize „personal superintelligence“ znamená AI, která nejen odpovídá na otázky, ale rozumí vašemu kontextu, protože je na něm postavena.
Od demonstrací k praktickému použití: Multimodální schopnosti nejsou prezentovány jako technologická ukázka, ale jako řešení každodenních problémů – od čtení etiket po porozumění zdravotním datům.

Jak říká Meta ve svém oznámení: „The future of Meta AI is rooted in the relationships and context already at the center of your life.“

Zdroje

Zdroj	Odkaz
Meta Newsroom – oficální oznámení	about.fb.com/news/2026/04/introducing-muse-spark/
Meta AI technický blog	ai.meta.com/blog/introducing-muse-spark-msl
VentureBeat – analýza	venturebeat.com
The Next Web – recenze	thenextweb.com
Deeper Insights – Contemplating mode	deeperinsights.com
Forbes – Scale AI akvizice	forbes.com
SiliconRepublic – zdravotní AI	siliconrepublic.com
MarkTechPost – benchmarky	marktechpost.com
Mashable – strategický kontext	mashable.com
Pymnts – nasazení a dostupnost	pymnts.com