Tiedonkeruu keskustelullista tekoälyä varten

Kuinka lähestyä tiedonkeruuta keskustelullista tekoälyä varten

Nykyään meillä on joitain puhuvia robotteja chatbotteina, virtuaaliassistentteina ja muissa kodeissamme, autojärjestelmissämme, kannettavissa laitteissamme, kodin automaatioratkaisuissa jne. Nämä laitteet kuuntelevat tarkasti, mitä sanomme ja miten sanomme ja hakevat tuloksia tai suorittavat tiettyjä tehtäviä. .

Ja jos olet käyttänyt avustajaa, kuten Siri tai Alexa, huomaat myös, että ne muuttuvat päivä päivältä omituisemmiksi. Heidän vastauksensa ovat nokkelaa, he puhuvat takaisin, tyhmitsevät, antavat kohteliaisuuksia ja käyttäytyvät inhimillisemmin kuin jotkut kollegat, joita saatat tuntea. Emme vitsaile. PwC:n mukaan, 27 % käyttäjistä, jotka olivat vuorovaikutuksessa äskettäisen asiakaspalvelukumppaninsa kanssa, eivät tienneet, puhuivatko he ihmisen vai chatbotin kanssa.

Tällaisten monimutkaisten keskustelujärjestelmien ja -laitteiden kehittäminen on erittäin monimutkaista ja pelottavaa. Se on erilainen pallopeli, jossa on erilaiset kehityslähestymistavat. Siksi ajattelimme, että meidän pitäisi eritellä se sinulle, jotta ymmärrät paremmin. Joten jos aiot kehittää keskustelevaa tekoälymoottoria tai virtuaalista avustajaa, tämä opas auttaa sinua saamaan selvyyden.

Keskustelevan tekoälyn merkitys

Kun teknologiasta tulee entistä kiinteämpi osa elämäämme uusien laitteiden ja järjestelmien muodossa, syntyy tarve lyödä esteitä, rikkoa käytäntöjä ja keksiä uusia tapoja olla vuorovaikutuksessa niiden kanssa. Pelkästään yhdistettyjen oheislaitteiden, kuten hiiren ja näppäimistön, käyttämisestä vaihdoimme käyttömukavuutta lisääviin hiirimattoihin. Sitten siirryimme kosketusnäyttöihin, jotka tarjosivat lisämukavuutta syötteiden syöttämiseen ja tehtävien suorittamiseen.

Kun laitteista tulee meidän laajennuksiamme, avaamme nyt uuden välineen komentamiseen äänellä. Meidän ei tarvitse edes olla lähellä laitetta käyttääksemme sitä. Meidän tarvitsee vain käyttää ääntämme sen lukituksen avaamiseen ja syötteidemme ohjaamiseen. Läheisestä huoneesta ajaessa ja toista laitetta samanaikaisesti käytettäessä keskustelullinen tekoäly suorittaa aiotut tehtävämme saumattomasti. Joten mistä aloitamme – kaikki alkaa korkealaatuisesta puhedatasta ML-mallien kouluttamiseksi.

Puheharjoitustietojen keräämisen perusteet

Tekoälyn harjoitustietojen kerääminen ja merkitseminen keskustelua varten on hyvin erilaista. Ihmisten käskyihin liittyy paljon monimutkaisuutta, ja erilaisia ​​toimenpiteitä on toteutettava sen varmistamiseksi, että kaikki näkökohdat huomioidaan vaikuttavien tulosten saavuttamiseksi. Katsotaanpa, mitä puhedatan perusasiat ovat.

Luonnollisen kielen ymmärtäminen (NLU)

Jotta chatbotit ja virtuaaliset avustajat ymmärtäisivät tekstiviestimme tai komentomme ja vastaisivat siihen, kutsutaan prosessia NLU toteutetaan. Se tarkoittaa Luonnollisen kielen ymmärtäminen ja sisältää kolme teknistä käsitettä, jotka tulkitsevat ja käsittelevät erilaisia ​​syöttötyyppejä.

  • Tarkoitus

    Kaikki alkaa tarkoituksesta. Mitä tietty käyttäjä yrittää välittää, viestiä tai saavuttaa komennon avulla? Etsiikö käyttäjä tietoa? Odottavatko he päivityksiä toimiin? Käskevätkö he järjestelmän suorittamiskäskyn? Miten he käskevät sitä? Onko se kysymys vai pyyntö? Kaikki nämä näkökohdat auttavat koneita ymmärtämään ja luokittelemaan aikeet ja tarkoitukset ilmatiiviiden vastausten aikaansaamiseksi.

  • Utterance Collection

    Komento "Missä on lähin pankkiautomaatti?" ja komento "Etsi minulle lähellä oleva pankkiautomaatti." Nyt ihmiset ymmärtäisivät, että molemmat tarkoittavat samaa asiaa, mutta koneet on selitettävä tällä erolla. Tarkoituksena ne ovat samat, mutta se, miten tarkoitus on muotoiltu, on täysin erilainen.

    Lausuntojen kokoelmassa on kyse erilaisten lausumien ja lauseiden määrittelemisestä ja kartoittamisesta tiettyihin tavoitteisiin tehtävien ja vastausten tarkkaa suorittamista varten. Teknisesti datamerkintöjen asiantuntijat työskentelevät puhedatan tai tekstidatan parissa auttaakseen koneita erottamaan tämän.

  • Entiteetin louhinta

    Jokaisessa lauseessa on erityisiä sanoja tai lauseita, joilla on painoarvoa, ja juuri tämä painotus johtaa kontekstin ja tarkoituksen tulkintaan. Koneet, kuten jäykät järjestelmät ne ovat, on syötettävä lusikalla sellaisiin kokonaisuuksiin. Esimerkiksi "Mistä löydän kitaran kielet lähellä 6th Avenuea?"

    Jos tarkennat lausetta, Find on entiteetti yksi, kielet kaksi, kitara on kolme ja 6th Avenue on 4. Koneet yhdistävät nämä entiteetit sopivien tulosten saamiseksi, ja tämän tapahtumiseksi taustalla työskentelevät asiantuntijat.

Valmiit ääni-/puhe-/äänitietojoukot, joiden avulla voit kouluttaa keskustelevan tekoälymallisi nopeammin

Dialogien suunnittelu keskustelulliseen tekoälyyn

Tekoälyn tavoitteena on ollut pääasiassa ihmisen käyttäytymisen jäljittäminen eleiden, toimien ja vastausten avulla. Tietoisella ihmismielellä on luontainen kyky ymmärtää kontekstia, tarkoitusta, sävyä, tunteita ja muita tekijöitä ja reagoida niiden mukaisesti. Mutta miten koneet voivat erottaa nämä näkökohdat? 

Dialogien suunnittelu keskusteleva AI on hyvin monimutkainen ja mikä tärkeintä, melko mahdotonta ottaa käyttöön universaali malli. Jokaisella on erilainen tapa ajatella, puhua ja vastata. Jopa vastauksissa me kaikki ilmaisemme ajatuksemme yksilöllisesti. Koneiden on siis kuunneltava ja reagoitava vastaavasti. 

Tämä ei kuitenkaan ole yhtä sujuvaa. Kun ihmiset puhuvat, sellaiset tekijät kuin aksentit, ääntäminen, etnisyys, kieli ja muut tulevat mukaan, eikä koneiden ole helppoa ymmärtää ja tulkita sanoja väärin ja vastata niihin.. Koneet voivat ymmärtää tietyn sanan lukemattomilla tavoilla, kun sen sanelevat intialainen, britti, amerikkalainen ja meksikolainen. On olemassa monia kielimuureja, jotka tulevat peliin, ja käytännöllisin tapa löytää vastausjärjestelmä on visuaalinen ohjelmointi, joka perustuu vuokaavioon. 

Erillisten lohkojen kautta eleet, vastaukset ja laukaisimet, kirjoittajat ja asiantuntijat voivat auttaa koneita kehittämään hahmoa. Tämä on enemmän kuin algoritmikone, jonka avulla saadaan aikaan oikeat vastaukset. Kun syötettä syötetään, tieto kulkee vastaavien tekijöiden kautta, mikä johtaa oikeaan reaktioon koneiden toimittamiseen. 

Valitse D monimuotoisuutta varten

Kuten mainitsimme, ihmisten vuorovaikutus on hyvin ainutlaatuista. Ihmiset ympäri maailmaa tulevat eri elämänaloista, taustoista, kansallisuuksista, väestöstä, etnisistä ryhmistä, aksentteja, sanamuotoa, ääntämistä ja paljon muuta. 

Jotta keskustelubotti tai järjestelmä olisi yleiskäyttöinen, sitä on koulutettava mahdollisimman monipuolisella harjoitustiedolla. Jos esimerkiksi mallia on koulutettu vain yhden tietyn kielen tai etnisen alueen puhedatalla, uusi aksentti hämmentää järjestelmää ja pakottaisi sen antamaan vääriä tuloksia. Tämä ei ole vain noloa yritysten omistajille, vaan loukkaa myös käyttäjiä. 

Tästä syystä kehitysvaiheeseen tulisi sisältyä tekoälyn koulutusdata runsaasta joukosta erilaisia ​​tietojoukkoja, jotka koostuvat kaikista mahdollisista taustoista tulevista ihmisistä. Mitä enemmän aksentteja ja etnisiä ryhmiä järjestelmäsi ymmärtää, sitä yleismaailmallisempi se olisi. Lisäksi käyttäjiä ärsyttäisi enemmän virheellinen tiedonhaku, vaan heidän syötteidensä ymmärtämättä jättäminen. 

Harhaisuuden poistamisen pitäisi olla ensisijainen tavoite, ja yksi tapa, jolla yritykset voivat tehdä tämän, on valita joukkolähdetieto. Kun hankit puhedatasi tai tekstidatasi joukkoon, annat ihmisten ympäri maailmaa osallistua tarpeisiisi, jolloin tietopankistasi on vain terveellistä (Lue blogi ymmärtämään tiedon ulkoistamisen edut ja sudenkuopat joukkolähdetyöntekijöille). Nyt mallisi ymmärtää erilaisia ​​aksentteja ja ääntämistä ja vastaa niiden mukaisesti. 

Tie eteenpäin

Keskustelevan tekoälyn kehittäminen on yhtä vaikeaa kuin lapsen kasvattaminen. Ainoa ero on, että vauva lopulta kasvaa ymmärtämään asioita ja kehittyy paremmin kommunikoimaan itsenäisesti. Koneita on työnnettävä jatkuvasti. Tällä alalla on tällä hetkellä useita haasteita, ja meidän pitäisi tunnustaa, että meillä on joitain vallankumouksellisimmista keskustelupohjaisista tekoälyjärjestelmistä, jotka syntyvät näistä haasteista huolimatta. Odotetaan ja katsotaan, mitä tulevaisuus tuo tullessaan ystävällisille naapuruston chatboteillemme ja virtuaalisille avustajillemme. Sillä välin, jos aiot saada keskustelua edistävän tekoälyn, kuten Google Homen, kehitettävän yrityksellesi, ota meihin yhteyttä, jos tarvitset tekoälyn harjoitustietojasi ja merkintöjäsi.

Sosiaalinen osuus