A tegnapi iPhone bejelentés valóban nem hozott igazi meglepetést, de nem értem a fanyalgókat, mert jelentéktelennek vagy csalódást keltőnek egyáltalán nem nevezhetjük a tegnapi keynote-ot (hacsak amiatt nem, hogy az iPhone 4S magyar szempontból a legrosszabb elnevezés - “négyes iphone” kontra “iphone négyes”). Az új iPhone ugyanúgy néz ki, valamivel erősebb, picit gyorsabb, jobb kamerával bír, mint az aktuális modell, épp ahogy a konszenzus szólt. Kész, függöny, majd legközelebb.
Azért van itt még egy dolog. A Siri hangfelismerő rendszer és a személyi asszisztens szolgáltatás brutálisan erős.
Update: a posztban félreérthető módon hangfelismerést írtam, de lehet, hogy szerencsésebb lenne inkább beszédfelismésről vagy szimplán mesterséges intelligenciáról beszélni. Mindegy, így hagyom, de egyértelmű, hogy nem szimpla hangvezérlésről, hanem sokkal többről van szó.
Ha ez így tényleg működik...
A tegnapi rendezvényen látott demó és a fenti videó úgy is lehengerlő, hogy már előzetesen is szinte biztosra vette mindenki a hangvezérlés teljes felújítását. A hasonló hang-, kép-, arc-, nyelvfelismerő rendszereknél persze gyakran előfordul, hogy a bemutatókon látottakat közel sem hozza a valóságban, és egy zajos utcasarkon hiába veszem elő a legszebb angol kiejtésemet, nem fogok tudni semmit előcsalni a kütyüből.
De ha működik, akkor az tekintélyes lépés a hangvezérlés terén, és úgy általában új frontot nyit a különféle interfészek versengésében. Ne feledkezzünk meg róla, hogy a számítástechnika történetében az új korszakokat az interakció módjának megváltozása jelölte ki, a lyukkártyától az egérrel pöcögtetett grafikus felületen át a mobilszámítástechnikát (ha úgy tetszik, poszt-PC korszakot) meghatározó érintőképernyőig.
Az új interakciós megoldásokra tehát érdemes odafigyelni, mert egyszer a nem is olyan távoli jövőben újabb mérföldkövet jelölhet ki egy ilyen fejlesztés. Nem állítom persze, hogy ez a fordulópont épp a hangvezérlés, és pláne nem, hogy pont az Apple Sirije lesz, de a valószínűsége egyértelműen nem nulla. (Steve Jobs személyi kultuszát egyébként lehet utálni, de fontos leszögezni, hogy két ilyen interakciós sarokpont megalkotásában és/vagy elterjesztésében is elévülhetetlen érdemeket szerzett, ezt nem sokan mondhatják el magukról).
A hangosan kiadott parancsokkal több probléma is lehet, kezdve a már említett zajos környezettől a privát szféráig (nem biztos, hogy egy tömött metrón akarnánk megvitatni a telefonnal a bevásárlólistát vagy a naptárbejegyzéseinket). Tíz éve persze még “bunkofonálás” volt az is, ha a buszon telefonáltunk, ma már fel sem tűnik, és hosszasan lehetne sorolni azokat a helyzeteket, amikben feltétel nélkül használnánk a lehető legfejlettebb hangvezérlést, amihez csak hozzáférünk.
Mindenhová bicajjal megyek például, és teljesen rászoktam a headsetre, ha a Voice Control képes lenne felismerni, amit mondok, biztosan nem állnék meg nyomogatni a kijelzőt (így sem állok meg persze, előbb-utóbb telefonnal a kezemben fog kigyalulni egy pótos IFA). De nem is kell ilyen speciális felhasználásokra gondolni, hiszen a beszéd még mindig a leggyorsabb, legspontánabb (létezik ez a szó?) és legegyszerűbb módja a gondolataink kifejezésének.
Küzdelem egy zsákutcáért?
Visszakanyarodva az iPhone 4S asszisztenséhez, érdemes megemlíteni, hogy nem az Apple saját fejlesztéséről van szó. Több helyen is úgy jött le a hír, hogy az Apple Sirinek nevezte el az új képességet, ami legjobb tudásom szerint nem igaz, a Siri a Stanford Research Institute spin-off cége volt, amit tavasszal vett meg az Apple, volt erről szó már itt is. Az Apple korábban is előszeretettel vásárolt fel kisebb cégeket a speciális tudásuk és képességeik miatt, ebben a tekintetben tehát a Siri bekebelezése nem lóg ki a sorból.
Olvasnivaló a Dotkomon:
Félrebeszélt vagy titkot árult el az Apple alapítója?
Az apró bökkenő, hogy a Siri egyik központi képessége, a hangfelismerés sem saját cucc, a technológiát a Nuance Communications licenceli (a licenc szót küldeném Bodnár Ádámnak a HWSW szerkesztőségébe és mindenkinek aki szereti, mert a múltkor jogosan tette szóvá, hogy licensznek írtam), a Nuance pedig sok meghatározó szereplőnek szállít hasonló megoldásokat.
Ennek ellenére könnyen elképzelhető, hogy az Apple berkein belül a személyi asszisztens gyorsabban el tud jutni oda, hogy tényleg a felhasználói élmény integráns részét képezze, mint más szereplőknél. Sőt, akár főpróba is lehet például egy hangvezérelt otthoni médiarendszer - vagy akár home automatization - középpontjába kerülő Apple TV számára is, de ha elengedjük a fantáziánkat, a lehetőségek végtelenek: össze lehetne kombinálni a személyi asszisztenst a Google önmagát vezető autójával, meg időgéppel és láthatatlanná tévő festékkel is.
Nagy kérdés persze, hogy pontosan mekkora lépéselőnybe is került az Apple ezen a fronton, ami ismétlem, simán lehet zsákutca is. Vannak itt azért nagyágyúk, a Google például a nagyon hasonló nyelvfelismerés és valós idejű fordítás területén brutális tudással bír, arabról hollandra tolmácsolni pedig nem gyengébb képesség, mint felismerni, hogy amit most beszélek, azt emailbe akarom írni.
A hardver most csak ennyi
Az iPhone 4S egyéb újdonságain fanyalgók nyugodtan felkészülhetnek arra, hogy az iPhone hardverében egyre kevesebb brutális és formabontó technológiai innovációt fogunk látni az előttünk álló években, főként erősebb processzorok, nagyobb memóriák, szebb és összetettebb kamerák és nagyobb sávszélességet lehetővé tévő vezetéknélküli technológiák jönnek, meg persze az ezeket lehetővé tévő akkumulátorok (a kiváló Heti Meteor legutóbbi adásában is elhangzott egyik kedvenc vesszőparipám, hogy aki az aksin siránkozik, az nem veszi számításba, hogy úgy bír ki egy napot az iPhone, hogy közben egy páréves asztali gép ereje van benne).
Soha ne mondjuk persze, hogy soha, meglepetések mindig jöhetnek, de az aktuális disruption megtörtént, az okostelefonok terén inkább már a commoditization zajlik. Erre utal a tegnapi prezentáció is, ahol az Apple nem azt hangsúlyozta, hogy mennyire más és új piacot nyitott, hanem hogy egy meglévő hatalmas piacon mekkora részesedést hasít ki, és milyen erős a dominanciája a fogyasztók fejében. Ahogy a Forbes is rámutat, az Apple bemutatóin is a hardverről a szoftverre - Siri, iCloud, iOs - tevődött át a hangsúly. Most épp ilyen időszakot élünk, nem lehet minden évben újfajta űrhajót építeni.
Update: A korábbi hangvezérléses példákkal - Microsoft, Android, stb. - kontrázók figyelmébe ajánlom szekerkaa kommentjét, szépen, plasztikusan magyarázza el a különbséget.