Kapcsolódó cikkek
- A hazai okostelefonpiac ezüstérmese a Xiaomi 2022. május 10.
- Hozzánk is megérkezett a Xiaomi 12 sorozat 2022. április 2.
- Elérhető áron érkeznek a Xiaomi új telefonjai 2022. március 30.
- Vadonatúj viselhető eszközök a Xiaomitól 2022. március 16.
- Áprilisban érkezik a Xiaomi 12 termékcsalád 2022. március 16.
- Négy új készülékkel jelentkezik a Xiaomi 2022. február 19.
- Megjelent a vadonatúj Redmi Note 11 termékcsalád 2022. január 26.
- Újra kinyit a Xiaomi Store az Arena Mall-ban 2021. november 26.
- Itthon is elindul a MI-Home webshop 2021. november 12.
- Roborock S7 robotporszívó bemutató 2021. október 12.
Legfrissebb híreink
- Nagy felbontás, gyors sebesség és MI-alapú képfelismerés
- A Sony bejelenti az első G Master F2-es rekesznyílású standard zoomobjektívet
- T-esport Bajnokság: Európa legjobbjai mérkőztek meg a hétvégi budapesti döntőn
- Idén az üvegfalak áttöréséről szól a telekom ünnepi kampánya
- A Samsung különleges megoldásait díjazták
“Own My Voice” projekttel segít a Xiaomi
Az internetes szolgáltatásokat nyújtó, valamint IoT platformon keresztül kommunikáló okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi most rántotta le a leplet legújabb, az akadálymentesítés jegyében létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásáról. A Xiaomi AI Lab által kifejlesztett, a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát arra használják, hogy egyedi és testreszabott hangot generáljanak beszédzavarral élő felhasználók számára.
Az érintett felhasználók mostantól a "saját hangjukat" használva, nem pedig a szokásos monoton géphangon kommunikálhatnak másokkal. Ez a sikeres kezdeményezés a Xiaomi Műszaki Bizottság "Own My Voice" projektje előkészítő kutatásainak része. A cég "Tech for Good" kampánya illeszkedik a Xiaomi távlati céljaihoz, amelyek fő üzenete: az "innovatív technológia segítségével mindannyiunknak jobb élete lehet".
Miért indította el a Xiaomi ezt a projektet?
A Xiaomi törődik az emberekkel, és a technológiai innováció segítségével törekszik az igényeik kielégítésére. A cég felismerte, hogy az érintettek is egyedi, saját hangjukat használva szeretnének kommunikálni a mindennapok során, így az "Own My Voice" projektet előkészítő csapatnak lett egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.
Zhu Xi, a Xiaomi Technológiai Bizottsága Tech for Good nagykövete elmondta: „Mi is izgatottan figyeljük, mennyi értéket teremt számunkra a technológiai innováció és ezek miként segíthetik a felhasználókat abban, hogy minél inkább önazonosak lehessenek.”
Hogyan valósította meg a Xiaomi a projektet?
A legmegfelelőbb és a leginkább személyre szabott tónusok létrehozása érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért föl arra, hogy kölcsönözze a hangját a kezdeményezéshez. Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, amely referencia lehet a felhasználó számára.
A személyre szabás érdekében – a személyiségi jogok védelmének szem előtt tartásával – a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívják segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.
Az "Own My Voice" projekt a legfejlettebb algoritmusokat kombinálja a Xiaomi saját fejlesztésű beszédtechnológiájával, hogy az így létrehozott tónus különlegesnek és hitelesnek hangozzon, ezzel alapozva meg a személyre szabott beszédszintetizációt a beszédzavarral élők számára is.
Miért jelentős ez a projekt?
Az innováció legfontosabb elemét a Xiaomi AI Lab beszédtechnológiával foglalkozó szakértői csoportja biztosítja, akik 2017 óta 37 hangszintetizálással kapcsolatos tudományos közleményt publikáltak olyan nívós nemzetközi fórumokon, mint például az International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Az "Own My Voice" elsősorban az általuk kifejlesztett Text-To-Speech technológiára támaszkodik, és a sikerének kulcsa is ez lehet.
Ezzel a technológiával intonációjában, dinamikájában és sebességében a valódi emberi hanghoz hasonló szintetizált hang hozható létre, amelynek révén a mesterségesnek ható, monoton géphangot egy természetesebb tónus váltja fel. Jelenleg ez a technológia számos olyan okoskészüléken elérhető, amelyben ott van a Xiaoai, a Xiaomi MI-alapú hangasszisztense. Az "Own My Voice" projekt azt demonstrálja, hogy Text-To-Speech technológia miként válhat széles körben alkalmazhatóvá az akadálymentesítés érdekében, és hogyan javíthatja a felhasználói élményt.
Zhu Xi hozzátette: „Ha korán felismerjük és figyelembe vesszük a problémában érintett felhasználói csoportok igényeit, az a technológia elterjesztésének folyamatát is jelentősen lerövidítheti, azt is elősegítve, hogy a speciális igényekkel rendelkező felhasználók azonnal a részesei lehessenek a legújabb fejlesztéseknek.”
A Xiaomi a jövőben is szem előtt tartja majd az érintett felhasználói kör visszajelzéseit, törekedve a megoldás minél szélesebb körű hozzáférhetővé tételére. A Xiaomi célja továbbra is az, hogy elérhetővé tegye a legfejlettebb technológiát, és a műszaki innováció révén kielégítse a legkülönbözőbb igényeket.