Az Amazon megkönnyítette a hangok hozzáadását az egyéni Alexa Skills-hez

Amazon Alexa bajnokként ismernek el, és több mint húsz egyedi készséget tettem közzé a platformon. Továbbra is új módszereket keresek ennek a technológiának a kibővítésére, és a felhasználói élmény javításának egyik legjobb módja a hangok hozzáadása. Tekintettel az Amazon Alexa platform legújabb fejlesztésére, ez csak még könnyebbé vált. Itt egy rövid áttekintés arról, hogyan használhatja ki ezt az új funkciót.

Hogyan működik az Amazon Alexa

Az Alexa platform képes lehetővé tenni harmadik féltől származó fejlesztők által készített egyedi készségeket. Most már több mint 30 ezer elérhető, és az Alexa-felhasználók milliói engedélyezhetik őket eszközeiken. Ezek a pizzák megrendelésétől egy népszerű lánctól kezdve az alvást elősegítő hangjátékokig terjednek.

Ezen egyedi készségek architektúrájának két eleme van. Az első az a hangkomponens, amely az Alexa platform gépi tanulási modelljeit használja fel. Ez az, ami a kimondott szókéréseket utasítássorozattá alakítja.

A másik komponens az if / then / else logika, amely eldönti, hogy a felhasználónak milyen választ kell kapnia. Ennek az AWS Lambda funkciója van.

A készségek fejlesztése érdekében további AWS-szolgáltatások, valamint harmadik féltől származó eszközök használhatók. Ez magában foglalja az egyedi MP3 hangok és grafikák rögzítését, amelyeket a Lambda funkció segítségével kihasználhat.

A hangok hozzáadásához az MP3 fájlokat egy S3 vödörbe töltik fel, és a megfelelő hozzáférési házirendet alkalmazzák, hogy az Alexa eszközön olvasható legyen.

Kihívások egyedi hangok hozzáadásával

A hangok egyéni készségekbe való felvételének egyik akadálya a kiváló minőségű hangok rögzítésének képessége volt. Ezeknek a hangoknak meg kell egyezniük a platform pontos szabványaival, beleértve a bitsebességet és a mintavételi arányt is. Ez hangszerkesztési szakértelemmel, például az Audacity szoftverrel végezhető el, de időt ad a készség fejlesztésére.

A kiváló minőségű hangok rögzítése szintén kihívást jelenthet. Vannak mobileszközökre alkalmas alkalmazások, amelyek lehetővé teszik a felvételt, de a hangok sokféle elérése nehéz. Például egy repülőgép ordításának vagy az elefánt hangjának rögzítése.

Alternatív megoldásként az Alexa fejlesztő olyan hangokat kereshet, amelyeket mások rögzítettek. Az interneten vannak olyan tárolók, amelyek rendelkeznek ilyenekkel, de a legtöbb pénzbe kerül a licenceléshez, és a megfelelő hangattribútumok megszerzéséhez újra kell mintázni olyan szoftverekkel, mint az Audacity.

Ingyenes MP3 tartalom

Az Amazon most közzétette a platform által megkövetelt pontos szabványok szerint már rögzített több száz hang katalógusát. Csakúgy, mint a fenti architektúrában, ezeket egy S3 vödörben teszik közzé az AWS-en, és bármely egyedi készség felhasználhatja őket.

A teljes lista megtalálható a fejlesztői oldalon, és itt vannak a fő kategóriák.

A tartomány kiterjedt. A motorkerékpár-motorok, a tűzijáték zajai és a medve üvöltése mind kéznél vannak. Ezek használatához nincs szükség jogdíjra, és a hangklipek letöltésének költségeit nem terheljük az AWS-számládon.

Hogyan kell használni a hangot egy alapkészségben

Ha most kezdi az Amazon Alexa használatát, kezdje az Alexa GitHub oldal alapvető sablonjaival. Ez magában foglalja a trivia készség, a ténytudás vagy az egyszerű találgatásokat. Például nemrég publikáltam egy szórakoztató gyerekek készségét, a Húsvéti tojásvadászatot. Itt található a teljes repo a GitHub-on, beleértve mind a Lambda funkciót, mind a szándék modellt.

Az üzenetválaszok bármelyikével hozzáadhatja az SSML-szintaxist, hogy az MP3 fájlra mutató linket az S3 vázlatba foglalja. Íme egy példa a Welcome Handler-től a húsvéti tojás készséghez.

// This is the initial welcome message var welcomeMessage = "Welcome to the Easter Bunny Egg Hiding Game. I will ask you multiple questions that you should answer yes or no. Based on your choices, I will make a recommendation on where to hide an egg. Are you ready to begin?"; this.emit(':ask', welcomeMessage, repeatWelcomeMessage);

Amikor a felhasználó először meghívja ezt az egyedi készséget, az Alexa eszköz lejátssza a trombita-bugle hangfájlját, majd felolvassa a szintaxist a szokásos hanggal.

Készen áll a kezdésre?

Folytassa, és regisztráljon egy ingyenes fejlesztői fiókot az Amazon-on, és kezdje el építeni első készségeit még ma! Az Amazon fejlesztői blogja nagyszerű forrásokkal rendelkezik a téma kiaknázására, beleértve ezt a közelmúltbeli bejegyzést, amely ötleteket ad az új tartalom használatáról.