by Szele Tamás 2023. Jun 02.

Amikor a szó nem száll el

Ezeken az oldalakon sokat foglalkozunk mostanában a mesterséges intelligencia és a művészetek, a kreativitás kapcsolatával, eddig azonban a sajtó és az MI viszonya nem sokszor került szóba.

Ennek az az oka, hogy az új technológiát sajtóberkekben is meglehetősen vegyesen fogadták, főként szövegalkotási képességei miatt. Most egy olyan szolgáltatásra, az Alrite-ra hívjuk fel a figyelmet, amely kétségtelenül hasznunkra válik.

Eredetileg pont írásos kommunikációra tervezték ezeket a nagy nyelvi modelleket, a képalkotás funkció később jelent meg – és nem akarom gyászba borítani a kollégákat, de a NewsGuard, egy sajtómegbízhatóság értékelésével foglalkozó világcég épp május elsején publikálta jelentését, mely szerint már találtak negyvenkilenc olyan híroldalt, melyet emberi beavatkozás nélkül generáltak, MI segítségével, sőt, ezeken keresztül még álhíreket is próbáltak terjeszteni. Az igaz, hogy az eredmény minden kritikán aluli lett, és a termékeken látszik, hogy mesterségesek, de van olyan olvasó, nem is egy, akinek így is tökéletesen megfelelnének.

Forrás: AlriteForrás: Alrite

Ettől még nem kell temetni a szakmát, igaz, hogy komolyabb cégek is íratnak rövid tőzsdei információkat, sporthíreket MI-vel, sőt, már megjelentek a mesterségesen generált hírvideók is, ezeket főleg Kína próbálta alkalmazni politikai propaganda céljából, de azért nincs vége még az újságírásnak, sőt, most kezdődik csak igazán.

Persze ehhez az is kell, hogy a média világa ne féljen a mesterséges intelligenciától, hanem használja fel a saját céljaira. És nem úgy, ahogyan a fenti példák mutatják, nem hírt hamisítani kell ezzel az eszközzel, arra kevéssé is alkalmas, hanem megszabadulni a segítségével a szakma fárasztó, nehéz részétől.

Ott van például az interjúkészítés. Nincs médiamunkás, aki szívesen írná le az interjúk hangfelvételét, kimerítő kulimunka, órákat, teljes munkanapokat vesz igénybe – a szöveg hosszától függően – és akármilyen kedves, jó emberrel is beszéltünk, a hangfelvétel végére azon fogjuk kapni magunkat, hogy érdekes dolgokat kívánunk neki, ha még egy szót szól... Nos, ennek a terhét leveszi a vállunkról a mesterséges intelligencia, méghozzá egy magyar fejlesztésű szolgáltatás, az Alrite.

Forrás: AlriteForrás: Alrite

Amikor megjelent, akadt kolléga, aki azt mondta: ennek a felbukkanása volt a legjobb dolog, ami abban az évben történt vele. És valljuk meg, áldás is az írott sajtó számára, bár nem csak mi tudjuk használni, mindenhol alkalmazható, ahol hangzó szöveget írottá kell alakítani, így például filmek feliratozásánál is.

Az Alrite fejlesztője, a Régens már harminc éve aktív résztvevője az informatikai piacnak, ezalatt folyamatosan követték a különböző technológiák aktuális helyzetét, trendjeit. Mivel a mesterséges intelligencia területén már sok éve aktívan kutattak, szembeötlő volt, hogy más nyelveken számos jól használható speech-to-text modell érhető el, míg a kisebb nyelvek esetében, mint amilyen a magyar is, nem áll rendelkezésre ilyen megoldás. Bíztak benne, hogy sikerül a megfelelő minőségű algoritmust létrehozniuk, amely a piacon is hamar népszerűvé válhat a sokféle felhasználási lehetőség miatt – és sikerült is nekik, sőt, nem csak magyarul „beszél” vagy „ért” az Alrite, hanem hat másik nyelv, az angol, a német, a spanyol, a francia, a holland és a török nyelv felismerésére is képes. Felismeri, leírja, akár le is fordítja.

Persze ezt is sokáig fejlesztették. Magához az alapvető algoritmushoz is évek kutató-fejlesztő munkája kellett, és közben végig tudták, hogy sohasem lesz készen. Ugyanis a nyelv nem statikus dolog, nem marad örökké ugyanabban az állapotában, nap mint nap újabb szavak, fogalmak jelennek meg, így az Alrite-ot mindig tovább kell tanítani, megismertetni a köznyelvben megjelenő új tulajdonnevekkel (ilyenek voltak a Covid-vakcinagyártók vagy az ukrajnai háborúhoz kapcsolódó földrajzi- és személynevek), illetve folyamatos munkát jelent az egyes szakterületek speciális kifejezéseinek megfelelő leiratozása. Az alkalmazást már közel négy éve fejlesztik, és az eltelt idő során folyamatosan új, hasznos funkciókkal bővítették, amelyek a piaci trendek, a felhasználói visszajelzések és a cég saját UX és BA szakértőinek javaslatai alapján kerültek a lehetőségek közé. Eddig körülbelül harminc ember munkája fekszik az Alrite mostani állapotában.

A legnagyobb nehézség az új nyelvekre való tanítás esetén a nagy mennyiségű tanítóadat gyűjtése és a modellek pontosságának validálása, tesztelése. A saját modell létrehozása a kutatási-fejlesztési szakaszban okozott leginkább kihívást, amikor még nem volt egyértelmű, hogy sikerül-e jobb eredményt elérni a már létező megoldásoknál. A K+F projekteknek általában nehezen látható a vége, nehéz megmondani, hol van annak a határa, amikor már „elég jók”. Emiatt a piaci bevezetését követően az első hónapokban az Alrite is béta verziós termékként volt elérhető.

Forrás: AlriteForrás: Alrite

Az alkalmazás a megjelenésekor – tehát négy éve – még messze megelőzte a korát. Előállt az a különös helyzet, hogy ki kellett nevelni hozzá a piacot, el kellett magyarázni, mi is ez a program és mire alkalmas, de ahogy terjedni kezdett, nem volt előtte akadály: jelenleg hatvannégyezer regisztrált felhasználója van az Alrite-nak.

Természetesen folyamatos a fejlesztés, nem csak az új szavakra tanítják meg az algoritmust, az amúgy is megkerülhetetlen, de állandóan optimalizálják a jelenleg elérhető nyelvek algoritmusait is, pontosabb felismerés és új kifejezések azonosítása érdekében. Tehát minden nyelven zajlik a véget nem érő tanítás. Új nyelveket is hozzá akarnak adni a meglévőkhöz, azon is dolgoznak, hogy jegyzőkönyvek készítésekor – igen, erre is alkalmas ez a módszer – az egyes beszélőket ne csak gondolatjellel tudja jelölni a szoftver, hanem akár konkrét személyhez is köthetőek legyenek az adott szakaszok a felvételen, így precíz feljegyzés készíthető az elhangzottakról. Extra funkcióként arra is van lehetőség, hogy valós idejű feliratok készüljenek élőben streamelt közvetítésekhez.

Forrás: AlriteForrás: Alrite

Mindez megoldható a mesterséges intelligencia észszerű alkalmazásával – nos, erre jó, erre kell és lehet is használni az MI-t.

Régebben a szó elszállt, az írás megmaradt. Az Alrite megjelenése óta a szó is megmarad – írásban. És azonnal készen áll a leirat.

Amellett, hogy a hallássérültek számára nagyon hasznos a program, jelentősen megkönnyíti az alábbi területeken zajló munkát:

Média

A hangfelismerő technológia használatával megspórolható az az idő, amit korábban egy interjú begépelésére kellett fordítani, így jóval hamarabb készülhet el egy cikk. A videós tartalmakhoz  eredeti nyelvű, akadálymentesítést támogató felirat, illetve automatikusan idegen nyelvre fordított felirat hozható létre, amely nemzetközi elérést segíti. A technológiának köszönhetően már élő televíziós műsorok és streaming közvetítések valós idejű feliratozására is elérhető.

Oktatás

A beszédfelismerő szoftver segítségével az egyetemi előadások felvételeiből és oktatóanyagokból is készíthetünk e-jegyzeteket, mindezt minimális utómunkával. A szerkeszthető-letölthető szövegek mellett automatikus feliratokkal is elláthatók az oktatóvideók.

Meetingek, hivatali események, közgyűlések

A hivatalos meetingekről – például bizottsági ülésekről – jegyzőkönyv is készül, ám a jegyzetelés hosszadalmas. Ez a feladat egy hangfelismerésen alapuló leiratozó megoldással kiváltható: a megbeszélést így közvetlenül rögzíthetjük, a gyors és automatikus feldolgozást követően pedig a szöveget digitális jegyzőkönyvként is használhatjuk. Az alkalmazás segítségével az online megbeszélések, prezentációk is rögzíthetők, így a tartalmat utólag felvételként és szövegként is megoszthatjuk.

Archívumok

A hangfelismerő applikációba feltöltött fájloknál kereshetünk az adott fájl leiratában/feliratában, valamint az összes fájlban egyszerre, hogy megtaláljuk. pontosan hol hangzott el egy adott kifejezés. A kereséssel listázott találatokban elegendő rákattintani a keresett szóra, és a lejátszó pontosan oda ugrik, ahol az elhangzik a felvételen.

Ingyenesen kipróbálhatjuk az alkalmazást
Regisztráció ITT.
A webes felületen kívül mobilalkalmazásként is használható. Letölthető az App Store-ból és a Google Play-ből.

 

Cikkeink írásához az Alrite beszédfelismerő (speech-to-text) megoldást alkalmazzuk.

A nyitókép illusztráció (forrás: Alrite)

 

Szenvedélyesen szeretjük a kultúrát, a művészeteket és a stratégiai gondolkodást. Ez ingyen van. A lapkiadás és az online magazin működtetése azonban pénzbe kerül. Kérjük, ha teheti, támogassa az Art is Business hiánypótló munkáját!

Támogassa a kezdeményezésünket, legyen Ön is mecénás!