Puhetietojen keruu

6 hyväksi havaittua menetelmää puhetietojen keräämisen mukauttamiseen

Asiakkaita on useita eri tyyppejä – joillakin on selkeä käsitys puhetietojensa rakenteesta, ja toisilla on joustavampi lähestymistapa.

Palveluntarjoajana meidän on varmistettava, että molemmat asiakkaan vaatimukset täyttyvät. Kuitenkin asiakkaan kanssa, joka on joustava vaatimuksiinsa, on mahdollista, että hän ei ole täysin antanut puhetietojen kerääminen täydellinen ajatus.

Tässä tulee esiin puhetietojoukon tarjoajan panos.

Meillä on velvollisuus esitellä asiat, jotka on pidettävä mielessä ennen äänen käynnistämistä tiedonkeruu hanke, jotta tekoälyorganisaatiot voivat löytää toteuttamiskelpoisen, tehokkaan ja kustannustehokkaan ratkaisun.

Äänentunnistusmarkkinoiden odotetaan kasvavan maailmassa $ 27.16 miljardia 2026 10.7 miljardista dollarista vuonna 2020 CAGR:llä 16.8 %.

Katsotaanpa kaikkia tehokkaita tapoja tai kohtia, jotka on pidettävä mielessä ennen kuin mukautat puhetietojen kerääminen projekti.

Points to keep in mind while customizing speech data collection

  • Kielet ja väestötiedot
  • Kokoelman koko
  • Käsikirjoituksen rakenne
  • Äänivaatimukset ja -muodot
  • Toimitus- ja käsittelyvaatimukset
  • Muita tärkeitä huomioitavia seikkoja

Kielet ja väestötiedot

Hankkeessa tulee ensin määritellä kohdekielet ja kohdeväestö.

  • Kielet ja murre

    Aloita pitämällä mielessä projektin vaatimus – kielet, joille puheaineistoa kerätään ja mukautetaan. Ymmärrä myös erityinen pätevyysvaatimus. Pitäisikö osallistujan esimerkiksi olla äidinkielenään puhuva vai muu kuin äidinkielenään puhuva?

    Esimerkiksi – Englannin äidinkielenään puhuvat

    Juokseminen lähellä kielen kantapäätä on murretta. Jotta tietojoukko ei kärsisi harhoista, on suositeltavaa ottaa tarkoituksella käyttöön murteita osallistujien monimuotoisuuden huomioon ottamiseksi.

    Esimerkiksi – Australian englanninkieliset kaiuttimet

  • Maat

    Ennen räätälöintiä on tärkeää tietää, onko olemassa tietty vaatimus, että osallistujien tulee olla tietystä maista. Ja pitäisikö osallistujien asua tällä hetkellä tietyssä maassa.

    Esimerkiksi – Punjabia puhutaan eri tavalla Intiassa ja Pakistanissa.

  • Väestötiedot

    Kielen ja maantieteen lisäksi räätälöinti voidaan tehdä myös väestötietojen perusteella. Voidaan myös tehdä osallistujien kohdentaminen heidän ikänsä, sukupuolensa, koulutustasonsa ja muiden perusteella.

    Esimerkiksi – Aikuiset vs lapset tai koulutetut vs kouluttamattomat

Kokoelman koko

Tietojoukkosi vaikuttaa dataprojektisi suorituskykyyn. Tarvitsemasi kokoelmatietojen koko määrittää kuitenkin myös tarvittavat osallistujat.

  • Vastaajien kokonaismäärä

    Määritä projektiin tarvittavien osallistujien kokonaismäärä. Jos projekti vaatii kieltä äänitietojen kerääminen, sinun tulee analysoida vaadittava osallistujien kokonaismäärä kohdekieltä kohden.

    Esimerkiksi – 50 % amerikkalaisen englannin ja 50 % Australian englannin puhujia

  • Lausuntojen kokonaismäärä

    Puhetietojen kokoelman rakentamiseksi määritä lausumien tai toistojen kokonaismäärä osallistujaa kohti tai tarvittavien toistojen kokonaismäärä.

    Esimerkiksi – 50 osallistujaa 25 lausunnolla per osallistuja = 1250 toistoa

Käsikirjoituksen rakenne

Käsikirjoitus voidaan myös räätälöidä projektin tarpeita vastaavaksi, joten on suositeltavaa pyytää apua puheterapeutit suunnitella tekstinkulkua. Jos ML-mallia on koulutettava hyvin jäsennellylle datalle, siinä on otettava huomioon komentosarja ja työnkulku.

  • Käsikirjoitettu vs. käsikirjoittamaton

    Voit valita joko käsikirjoitetun tekstin tai luonnollisen tai käsikirjoittamattoman tekstin, jonka osallistujat lukevat.

    Käsikirjoitetussa tekstipuheessa osallistujat lukevat näytöllä näkyvän. Tätä menetelmää käytetään enimmäkseen komentojen tai ohjeiden tallentamiseen.

    Esimerkiksi – 'Sammuta musiikki', 'Nauhoita painamalla 1'.

    Käsikirjoittamattomassa puheessa osallistujille annetaan skenaarioita ja heitä pyydetään muotoilemaan lauseensa ja puhumaan mahdollisimman luonnollisesti.

    Esimerkiksi – 'Voitko kertoa minulle, missä on seuraava huoltoasema?'

  • Utterance Collection / Wakeup Words

    Jos käytetään käsikirjoitettua tekstiä, sinun on päätettävä käytettävien skriptien määrä ja lukeeko jokainen osallistuja yksilöllistä käsikirjoitusta vai komentosarjoja. Selvitä myös, sisältääkö komentosarja herätyssanoja ja -komentoja.

    Esimerkiksi -

    Komento 1:

    "Alexa, mikä on suklaakuppikakun resepti?"

    "Ok Google, mikä on suklaakuppikakun resepti?"

    "Siri, mikä on suklaakuppikakun resepti?"

    Komento 2:

    "Alexa, milloin on lento New Yorkiin?"

    "Google, milloin on lento New Yorkiin?"

    "Siri, milloin lento on New Yorkiin?"

Äänivaatimukset ja -muodot

Äänivaatimukset Äänenlaadulla on ratkaiseva rooli puheentunnistuksessa tiedonkeruu prosessi. Häiritsevät taustaäänet voivat vaikuttaa negatiivisesti kerättyjen äänimuistiinpanojen laatuun. Tämä saattaa myös heikentää äänentunnistusalgoritmin tehokkuutta.

  • Äänenlaatu

    Tallenteiden laatu ja taustamelun esiintyminen voivat vaikuttaa projektin lopputulokseen. Mutta jotkut puhedatakokoelmat hyväksyvät kohinan esiintymisen. On kuitenkin suositeltavaa ymmärtää paremmin bittinopeuden, signaali-kohinasuhteen, amplitudin ja muiden vaatimukset.

  • muodostuu

    tiedostomuoto, datapisteet, sisällön rakenne-, pakkaus- ja jälkikäsittelyvaatimukset määräävät myös puhetallenteiden laadun.

    Syy tiedostomuotojen tärkeyteen on se, että mallin on tunnistettava tiedoston ulostulo ja koulutettava tunnistamaan kyseinen äänenlaatu.

  • Määritä mukautettu äänivaatimus

    Mukautetut äänivaatimukset tulee mainita ennen keräilyprosessin aloittamista. Asiakkaat voivat valita mukautettuja äänitiedostoja, joissa tietyt tiedostot on yhdistetty yhteen.

Toimitus- ja käsittelyvaatimukset

Kun puhetiedot on kerätty, asiakkaat voivat halutessaan toimittaa sen tarpeidensa mukaan.

  • Transkriptio- ja huomautusvaatimus

    Jotkut asiakkaat vaativat tietojen transkriptiota ja merkitsemistä ennen toimitusta. Lisäksi ne saattavat edellyttää erityisiä merkintöjä ja segmentointia.

    Joskus on parempi etsiä puhekielen patologit ja asiantuntijoita auttamaan puheen litteroinnissa eri kielillä kohdekielen autenttisuuden säilyttämiseksi.

  • Tiedostojen nimeämiskäytännöt

    - tiedonkeruulomakkeet tulee määrittää noudatettavat tiedostojen nimeämiskäytännöt. Jos nimeämiskäytäntö on monimutkainen tai prosessin vakioalueen ulkopuolella, se voi houkutella ylimääräisiä kehityskustannuksia.

  • Toimitusohjeet

    Turvallisuus- ja toimitusohjeita tulee noudattaa hankkeen vaatimusten mukaisesti. Lisäksi tulee tarkentaa, toimitetaanko tiedot pieninä virstanpylväinä tai kokonaisena pakettina kerralla. Asiakkaat haluavat myös ajoissa edistymisen seuranta päivitykset, jotta he voivat seurata projektin tilaa.

Muita tärkeitä huomioitavia seikkoja

Mukautukset vaikuttavat siihen,

  • Tiedonkeruumenetelmät käytetty
  • Osallistujien rekrytointi
  • Toimituksen aikajana
  • Hankkeen alustavat kustannukset

Kun valitset oikeaa toimittajaa, sinun on varmistettava, että käytät henkilöä, jolla on sekä kokemusta räätälöintivaihtoehtojen tarjoamisesta että joustavuutta projektin skaalaamiseen vaivattomasti. Puhetietojen keruun luonne on se, että se kehittyy ja monimutkaisuus muuttuu ajan myötä, ja oikean palveluntarjoajan pitäisi pystyä pysymään tahdissa.

Kun tarvitset vain joustavuutta ja skaalautuvuutta, Shaip on oikea valinta. Tarjoamme räätälöityjä palveluita projektisi tarpeiden mukaan. Tarjoamme skaalautuvaa ja joustavaa tiedonkeruuratkaisut monikielisiin projekteihin kilpailukykyisin hinnoin. Keskustele asiantuntijoidemme kanssa saadaksesi tietää, kuinka puhedatan keräämis- ja räätälöintitekniikkamme toimivat keskustelun tekoälyn kehittämisessä.

[Lue myös: Puheentunnistuksen koulutustiedot – tyypit, tiedonkeruu ja sovellukset]

Sosiaalinen osuus