Luotetuimmat puhetiedonkeruupalvelut tekoälyllesi

Kouluta NLP -mallejasi, VA -laitteitasi, TTS -prototyyppejäsi ja paljon muuta laadukkailla keskustelutiedoilla ääni- ja puhedatan keräyspalvelujemme avulla

Äänitietojen kerääminen

Löydä äänidataputket ilman pullonkauloja

Esittelyssä olevat asiakkaat

Ammattimaiset ääni- / puhetiedonkeruupalvelut

Mikä tahansa aihe. Mikä tahansa skenaario.

Asiantuntemuksemme Shaipilla on korkealaatuisten puhetietoaineistojen luominen erilaisiin AI/ML-vaatimuksiin. Tarjoamme laajan valikoiman kieliä ja tallenteita erilaisissa asetuksissa, mikä tekee tietojoukostamme kattavia ja mukautettavia. OKeskitymme syöttämään malleja, joissa on suurin määrä mukautettua puhedataa mahdollisimman lyhyessä ajassa. Kun olemme mukana, voit odottaa: 

Puhekokoelma
  • Kuroitu korkealaatuinen monikielinen ääni- / äänidata tarkkuuden parantamiseksi
  • Korkein mahdollinen aluespesifisyys tasolle target monipuolinen skenaario setup
  •  Skaalaa ML-mallisi sopimaan erilaisiin väestöryhmiin ja toimialoihin
  • Tallennusympäristöt: Studion laatu, jossa on kristallinkirkas ääni minimaalisella taustamelulla ja Luonnolliset ympäristöt, jossa tallenteet sisältävät ympäristön ääniä matkimaan todellisia tilanteita.

100+

Maat

55K +

Puhetiedot

250+

Projektit

60+

Kielet (yli 100 murretta)

8 / 16 / 44 / 48 kHz

Ositusnopeus

Asiantuntemuksemme

Kohdista äänitiedot älykkäämpiä NLP-malleja varten

Shaip tarjoaa kokonaisvaltaisia ​​puhe-/äänidatan keräyspalveluja yli 100 kielellä, jotta puhetekniikat voivat palvella erilaisia ​​yleisöjä ympäri maailmaa. Voimme työskennellä kaikenkokoisten ja -kokoisten hankkeiden parissa; olemassa olevien valmiiden äänitietoaineistojen lisensoinnista, mukautetun äänidatan keräämisen hallintaan, äänen transkriptioon ja huomautuksiin. Riippumatta siitä, kuinka suuri puhedatan keräysprojekti on, voimme räätälöidä äänenkeruupalvelut tarpeidesi mukaan rakentaaksesi korkealaatuisia NLP-tietojoukkoja, jotka kohdistavat murteita, ääniä ja kieliä. Valitse laajasta puhe- ja äänitiedostojen valikoimastamme älykkäitä ääniasetuksia varten.

Monologipuhe

Monologi käsikirjoitettu ja spontaani puhe

Se keskittyy yhden puhujan puheen käsittelyyn. Käytä käsikirjoitettuja kehotteita syöttääksesi yksikanavaisiin äänitiedostoihin varmistaen, että yksilölliset puhemallit, äänet ja vivahteet tallennetaan.

Dialogipuhe

Dialogi käsikirjoitettu ja spontaani puhe

Kahden hengen vuorovaikutus, joka toistaa todellisen maailman keskusteluja ja dialogeja monikielisenä kaksikanavaisten tiedostojen ja kopioitujen resurssien avulla.

Monen osapuolen keskustelut

Ryhmä / Muti-puolue
keskustelut

Usean henkilön keskustelut, ryhmädynamiikan, päällekkäisyyksien ja vaihtelevien sävyjen vangitseminen puhemallien tarkkaan kouluttamiseen.

Herätyssanojen kokoelma

Herätyssana / Avainlause / Lausekokoelma

Opeta tekoälyjä tunnistamaan avainsanoja tai herätyssanoja tai -lauseita, joilla on samankaltainen merkitys, käyttämällä monipuolisia, rikkaita ja autenttisia lausumia edistyneen luonnollisen kielen käsittelyn ja ymmärtämisen avulla.

Akustinen puhe

Akustiset tiedot
Kokoelma

Voimme ammattimaisesti nauhoittaa studiolaatuista äänidataa, olipa kyse sitten ravintoloista, toimistoista tai kodeista tai eri ympäristöistä ja kielistä, samalla kun se kattaa laajemman akustisen alueen (Comprehensive Sound Datasets).

Automaattinen puheentunnistus

Automaattinen puheentunnistus (ASR)

Paranna automaattisten puheentunnistusjärjestelmien (ASR) tarkkuutta käyttämällä huippuluokan monipuolisia puhe-/äänitietojoukkoja useista eri väestöryhmistä.

Luonnollisen kielen ilmaisu

Monikieliset puhe-/ääniharjoitustiedot

Ammattitaitoiset kielialan ammattilaisemme ympäri maailmaa tarjoavat monikielisiä ääni-/puhetietoja eri kielillä ja murteilla. Tämä pyrkimys edistää maailmanlaajuista viestintää ja ylittää kielimuurit, mikä edistää osallistavampia ja tehokkaampia tekoälyratkaisuja.

Digitaaliset virtuaaliset avustajat

Teksti puheeksi
(TTS)

Rakenna tekstistä puheeksi (TTS) monikielinen malli maailmanlaajuisen työvoimamme avulla, joka auttaa sinua keräämään puhedataa yli 150 kielellä ja murteella parantaaksesi tekoälymallejasi auton ohjaimista chatboteihin ja oppimisratkaisuihin korkealla laadukasta äänidataa.

Puhelinkeskuksen tallenteet

Puhelinpalvelu
keskustelut

Aito vaihto agenttien ja asiakkaiden välillä, joka tukee lukuisia kieliä, kuten espanja, saksa, amerikkalainen englanti, bengali, japani, kiina ja hindi.

Success Stories

Keskustelevat tekoälytietojoukot, joissa on yli 3 8 tuntia dataa XNUMX kielellä

Halutessaan rakentaa monikielisen alustan intialaisille kielille, asiakas teki yhteistyötä Shaipin kanssa suurten tietojoukkojen keräämiseksi, segmentoimiseksi ja litteroimiseksi useilla Intian kielillä. Tämä auttaisi kehittämään tehokkaita puhemalleja, jotka voisivat antaa voiman asiakkaan innovatiiviselle uudelle alustalle.

Ongelma: Yli 3,000 8 tuntia äänidataa kerätty kahdeksalla intialaisella kielellä, segmentoitu ja litteroitu automaattisen puheentunnistuksen kehittämiseksi.

Ratkaisu: Toimitimme tiedonkeruun, segmentoinnin, transkription ja toimitimme JSON-tiedostot metadatan kanssa. Keräsimme 3000 tuntia äänidataa kahdeksalla Intian kielellä asiakkaan puheteknologiaprojektia varten.

Puhetietojen keruun tapaustutkimus

Syitä valita Shaip luotettavaksi puhedatan keräämiskumppaniksesi

Ihmiset

Ihmiset

Omistetut ja koulutetut ryhmät:

  • Yli 30,000 yhteistyökumppania tietojen luontia, merkintöjä ja laadunvalvontaa varten
  • Tunnistettu projektinhallintaryhmä
  • Kokenut tuotekehitystiimi
  • Talent Pool Sourcing & Onboarding -tiimi
Käsitellä asiaa

Käsitellä asiaa

Korkein prosessitehokkuus taataan:

  • Vankka 6 Sigma Stage-Gate -prosessi
  • Erityinen 6 Sigma -mallihihnan tiimi - tärkeimmät prosessin omistajat ja laatuvaatimukset
  • Jatkuva parantaminen ja palautesilmukka
foorumi

foorumi

Patentoitu alusta tarjoaa etuja:

  • Verkkopohjainen alusta loppuun
  • Moitteeton laatu
  • Nopeampi TAT
  • Saumaton toimitus

Valmiina puhe-/äänitietojoukot

LisätiedotKielitietojoukkoNäytteenottotaajuusTietojoukon tyyppiÄänitunnit yhteensäLyhyt kuvausTietojoukon kuvausÄänikanavanTallennusalustaWER (%)Audio FormatTranskriptiomuotoKäytä asiaaKaiuttimien määräCTA
PuheNew York English_GC_8New Yorkin englantiNew Yorkin englantifi8 kHzYleinen keskustelu107New Yorkin englannin yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 118, Mies 114, Tuntematon 0
PuheRussian_SM_48VenäläinenVenäläinenRU-RU48 kHzKäsikirjoitettu monologi2,398Venäläinen käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1689 Mies 1937 Tuntematon 214
PuhePunjabi_MApunjabiPunjabi (putkissa) punjabi Media Audio40Punjabi (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuhePunjabi_GCpunjabiPunjabi (putkissa) punjabiYleinen keskustelu100Punjabi (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuhePunjabi_CC_8punjabiPunjabi (putkissa) punjabiPuhelinkeskus60Punjabi (In Pipeline) Call-Center-tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuhePuola Puola_SM_48Puola (Puola)Puola (Puola)pl-PL48 kHzKäsikirjoitettu monologi1,482Puola Puola - Käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1324 Mies 701 Tuntematon 24
Puhepuola_MA_16KiillottaaKiillottaapl_pl16 kHzMedia Audio269Puolan median ääniLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 173 Mies 354 Tuntematon 6
PuheOriya_MAOriyaOriya (putkissa) tai_INMedia Audio40Oriya (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheOriya_GCOriyaOriya (putkissa) tai_INYleinen keskustelu100Oriya (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheOriya_CC_8OriyaOriya (putkissa) tai_INPuhelinkeskus60Oriya (In Pipeline) Call-Centerin tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheUusi-Seelanti_MA_16Uuden -Seelannin englanti Uuden -Seelannin englanti fi_NZ16 kHzMedia Audio400Uuden-Seelannin englantilaisen median ääniLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 367, mies 678, Tuntematon 26
PuheUusi-Seelanti_GC_8Uuden -Seelannin englanti Uuden -Seelannin englanti fi_NZ8 kHzYleinen keskustelu148Uuden-Seelannin englannin yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 167, mies 121, Tuntematon 4
PuheNew York English_MA_16New Yorkin englantiNew Yorkin englantifi16 kHzMedia Audio140New York English Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 66, Mies 230, Tuntematon 11
PuheScottish_GC_8Skotlanti (englannin aksentti)Skotlanti (englannin aksentti)fi_AB8 kHzYleinen keskustelu292Skotlannin yleisen keskustelun tiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 285 , Mies 260, Tuntematon 3
PuheNew York English_CC_8New Yorkin englantiNew Yorkin englantifi8 kHzPuhelinkeskus103New Yorkin englanninkieliset puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 610, mies 532, tuntematon 0
PuheNetherlands_SM_48DutchDutchnl-NL48 kHzKäsikirjoitettu monologi1,205Hollantilainen käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1285 Mies 531 Tuntematon 3
Puhemeksikolainen_SM_48Espanja (Meksiko)Espanja (Meksiko)es-MX48 kHzKäsikirjoitettu monologi1,492Meksikon espanjalainen käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1016 Mies 1069 Tuntematon 95
PuheMarathi_MAmarathimarathi (putkissa) herra_INMedia Audio40Marathi (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheMarathi_GCmarathimarathi (putkissa) herra_INYleinen keskustelu100Marathi (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheMarathi_CC_8marathimarathi (putkissa) herra_INPuhelinkeskus60Marathi (In Pipeline) Call-Center-tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheMalayalam_MAmalajalamMalayalam (putkissa) ml_INMedia Audio40Malayalam (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheMalayalam_GCmalajalamMalayalam (putkissa) ml_INYleinen keskustelu100Malayalam (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheMalayalam_CC_8malajalamMalayalam (putkissa) ml_INPuhelinkeskus60Malayalam (In Pipeline) Call-Center-tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puhemalaiji_MA_16MalayMalayms_MY16 kHzMedia Audio344Malaiji Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 236, mies 626, tuntematon 47
PuheMalaiji_GC_8MalayMalayms_MY8 kHzYleinen keskustelu266Malaijin yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, malaiji MalesiassaDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 316, Mies 176, Tuntematon 0
PuheTelugu_GC_8telugutelugute_IN8 kHzYleinen keskustelu553Telugun yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 574 , Mies 564, Tuntematon 0
PuheBritannian englanti_WW_16UK EnglantiUK Englantifi_uk16 kHzWake Word200 KaiuttimetWake Word UK Englantiavainsanoja tiedon keräämiseen
  • 200 kaiuttimet
  • 4 ainutlaatuista näppäinlausetta kaiuttimessa
  • 25-30 toistettua näppäinlausetta yksittäistä avainlausetta kohden
  • 25-30 äänitiedostoa yksilöllistä avainlausetta kohden
  • Yhteensä 120 tallennettua puhetta puhujaa kohti
1 kanavaMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSukupuoli: 50 % miehiä, 50 % naisia, +/- 10 %.
PuheWalesin_GC_8kymri (englannin aksentti)kymri (englannin aksentti)fi_WL8 kHzYleinen keskustelu278Walesin yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 270, Mies 324, Tuntematon 0
PuheVietnamilainen_MA_16vietnamvietnamvi_VN16 kHzMedia Audio257Vietnamin median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 249, mies 200, Tuntemattomat 45
PuheVietnamilainen_GC_8vietnamvietnamvi_VN8 kHzYleinen keskustelu295Vietnamin yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia, pohjoinen (esim. Hanoi), keskeinen ja eteläinen (esim. Ho Chi Minh City).Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 400, mies 380, Tuntemattomat 2
PuheTurkkilainen Turkki_SM_48turkkilainen Turkkiturkkilainen Turkkitr-TR48 kHzKäsikirjoitettu monologi2,027turkkilainen TurkkiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1561 Mies 1241 Tuntematon 31
PuheThai_MA_8ThaiThaith_TH16 kHzMedia Audio173Thai Median ääniLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 143, Mies 502, Tuntematon 26
PuheThai_GC_8ThaiThaith_TH8 kHzYleinen keskustelu183Thaimaan yleinen keskusteluKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, epävirallinen rekisteri, jota käytetään ystävien keskenDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 338, Mies 96, Tuntematon 8
PuheTelugu_MAtelugutelugu (valmisteilla) te_INMedia Audio20Telugu (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheTelugu_GCtelugutelugu (valmisteilla) te_INYleinen keskustelu50Telugu (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheTelugu_CC_8telugutelugu (valmisteilla) te_INPuhelinkeskus30Telugu (In Pipeline) Call-Center-tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Telugu Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 207, Mies 963, Tuntematon 2
PuheKorean_SM_48KoreanKoreanko-KR48 kHzKäsikirjoitettu monologi1,955Korean käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1195 Mies 1134 Tuntematon 122
Puhetamili_MAtamil tamili (putkissa) ta_INMedia Audio40Tamil (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheTamil_GCtamiltamili (putkissa) ta_INYleinen keskustelu100Tamil (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheTamil_CC_8tamiltamili (putkissa) ta_INPuhelinkeskus60Tamil (In Pipeline) Call-Center tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puheruotsalainen_MA_16verkkokauppaverkkokauppasv_SE16 kHzMedia Audio278Ruotsin median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 195, mies 500, Tuntematon 21
PuheSwedish_CC_8verkkokauppaverkkokauppasv_SE8 kHzPuhelinkeskus250Ruotsin puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1581, mies 727, Tuntematon 2
Puheswahili_MA_16SuahiliSuahilisw_KE16 kHzMedia Audio265Swahili Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 118, Mies 493, Tuntematon 25
PuheSwahili_CC_8SuahiliSuahilisw_KE8 kHzPuhelinkeskus230Swahili-puhelukeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 611, Mies 833, Tuntematon 0
PuheEtelä-Afrikan englanti_MA_16Eteläafrikkalainen englantiEteläafrikkalainen englantifi_ZA16 kHzMedia Audio251Etelä-Afrikkalainen Englanti Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 235, Mies 432, Tuntematon 36
PuheEtelä-Afrikan englanti_CC_8Eteläafrikkalainen englantiEteläafrikkalainen englantifi_ZA8 kHzPuhelinkeskus261Etelä-Afrikan englanninkielisen puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1274 , Mies 935 , Tuntematon 1
PuheSingapore_MA_16Singaporen englantiSingaporen englantifi_SG16 kHzMedia Audio247Singapore Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 160, Mies 455, Tuntematon 37
PuheSingapore_CC_8Singaporen englantiSingaporen englantifi_SG8 kHzPuhelinkeskus218Singaporen puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 2139 , Mies 884, Tuntematon 21
PuheBoston_CC_8Boston englantiBoston englantifi8 kHzPuhelinkeskus177Bostonin puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 605, Mies: 711 ja Tuntematon: 0
PuheEnglanti syvä etelä_CC_8Englanti Deep SouthEnglanti Deep Southfi8 kHzPuhelinkeskus151Englanti Deep South -puhelukeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 221 , Mies 1004 , Tuntematon 7
Puhetanska_SM_48Tanskan kieliTanskan kielida-DK48 kHzKäsikirjoitettu monologi2,579Tanskalainen käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekuntia, tanska TanskastaMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1551 Mies 1233 Tuntematon 42
Puhetanska_MA_16Tanskan kieliTanskan kielida_DK16 kHzMedia Audio664Tanskan median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 369, Mies: 864, Tuntematon: 27
Puhetanskalainen_GC_8Tanskan kieliTanskan kielida_DK8 kHzYleinen keskustelu372Tanskan yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 311, Mies: 417, Tuntematon: 0
PuhePerinteinen kiina_SM_48Perinteinen kiinaPerinteinen kiinazh-TW48 kHzKäsikirjoitettu monologi1,028Perinteinen kiinaYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1069 Mies 262 Tuntematon 3
PuheYksinkertaistettu kiina_SM_48Yksinkertaistettu kiinaYksinkertaistettu kiinazh-CN48 kHzKäsikirjoitettu monologi2,762Yksinkertaistettu kiinaYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1920 Mies 1535 Tuntematon 270
Puhekiina_MA_16Kiinalainen englantiKiinalainen englantifi16 kHzMedia Audio249Kiinan median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 126, Mies: 346 ja Tuntematon: 6
PuheChinese_CC_8Kiinalainen englantiKiinalainen englantifi8 kHzPuhelinkeskus169Kiinan puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 1790, Mies: 523 ja Tuntematon: 13
PuheKanadalainen_SM_48Kanadan ranskaKanadan ranskaFR-CA48 kHzKäsikirjoitettu monologi1,222Kanadan ranskaYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 974 Mies 631 Tuntematon 1
PuheBoston_MA_16Boston englantiBoston englantifi16 kHzMedia Audio93Boston Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 43, Mies: 181 ja Tuntematon: 2
PuheBoston_GC_8Boston englantiBoston englantifi8 kHzYleinen keskustelu32Bostonin yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 53, Mies: 83 ja Tuntematon: 0
PuheEnglanti syvä etelä_GC_8Englanti Deep SouthEnglanti Deep Southfi8 kHzYleinen keskustelu56Englanti Deep South Yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 99, mies 31, tuntematon 0
PuheBengali_MABengalibengali (putkissa) bn_INMedia Audio40Bengali (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheBengali_GCBengalibengali (putkissa) bn_INYleinen keskustelu100Bengali (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheBengali_CC_8Bengalibengali (putkissa) bn_INPuhelinkeskus60Bengali (In Pipeline) Call-Center tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puheassami_MAassamiassami (valmisteilla) as_INMedia Audio40Assami (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheAssami_GCassamiassami (valmisteilla) as_INYleinen keskustelu100Assami (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puheassami_CC_8assamiassami (valmisteilla) as_INPuhelinkeskus60Assami (In Pipeline) Call-Center tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheArabia_SM_48ArabialainenArabialainenar-SA48 kHzKäsikirjoitettu monologi1,947Arabialainen kirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 838 Mies 1209 Tuntematon 78
PuheArabia_GC_8ArabialainenArabialainenar_AE8 kHzYleinen keskustelu292Arabia Yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, arabia Persianlahden maistaDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 171, Mies: 534 ja Tuntematon: 1
Puheafrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658Afrikaans-mediatiedostotLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 750, Mies: 1278 ja Tuntematon: 52
PuheAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzYleinen keskustelu368Afrikaans Yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, afrikaansia puhutaan AfrikassaDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 502, Mies: 390 ja Tuntematon: 2
Puhefi_US_MA_16Afrikkalainen Amerikan kansankieliAfrikkalainen Amerikan kansankielifi16 kHzMedia Audio154Afroamerikkalaisen kansankielisen median tiedotLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 151, Mies: 150 ja Tuntematon: 10
PuheHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia Audio216SINGLI Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 75, mies 380, tuntematon 0
PuheKorean_MA_16KoreanKoreanko_KR16 kHzMedia Audio204Korean median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 70 Mies 303, Tuntematon 25
PuheKorean_CC_8KoreanKoreanko_KR8 kHzPuhelinkeskus107Korean puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1086, Mies 210, Tuntematon 4
Puhekannada_MAkannadakannada (putkissa) kn_INMedia Audio40Kannada (In Pipeline) MediaäänitiedotLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puhekannada_GCkannadakannada (putkissa) kn_INYleinen keskustelu100Kannada (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puhekannada_CC_8kannadakannada (putkissa) kn_INPuhelinkeskus60Kannada (In Pipeline) Call-Center tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheJapanese_SM_48JapanilainenJapanilainenja-JP48 kHzKäsikirjoitettu monologi2,335Japanilainen käsikirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1460 Mies 1221 Tuntematon 194
PuheIrlanti_GC_8irlantilainenirlantilainenfi_IE8 kHzYleinen keskustelu192Irlannin yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 213 , Mies 153 , Tuntematon 0
PuheIndonesian_MA_16IndonesialainenIndonesialainenminä tein16 kHzMedia Audio643Indonesian median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 746, Mies 1507, Tuntematon 129
PuheIndonesian_GC_8IndonesialainenIndonesialainenminä tein8 kHzYleinen keskustelu496Indonesian yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, indonesiaDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 524, Mies 454, Tuntematon 2
Puhelatinalaisamerikkalainen_MA_16espanjalainen englantiespanjalainen englantifi16 kHzMedia Audio155Hispanic Call Media -ääniLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 140, Mies 219, Tuntematon 5
PuheHispanic_CC_8espanjalainen englantiespanjalainen englantifi8 kHzPuhelinkeskus212Espanjankieliset puhelinkeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 822, Mies 1262, Tuntematon 0
Puhefi_US_CC_8Afrikkalainen Amerikan kansankieliAfrikkalainen Amerikan kansankielifi8 kHzPuhelinkeskus211Afroamerikkalainen kansankielinen puhelukeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen: 612, Mies: 1242 ja Tuntematon: 12
PuheHINGLISH_CC_8HinglishHinglishhg_IN8 kHzPuhelinkeskus208SINGLI Puhelukeskuksen tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Dualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 822, Mies 1262, Tuntematon 0
PuheHindi_SM_48hindihindihi-IN48 kHzKäsikirjoitettu monologi2,867Hindi-kirjoitettu monologiYksipuheiset tallenteet, jotka ovat yleensä 5-30 sekunnin vaihteluvälilläMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 1977 Mies 1864 Tuntematon 147
Puhehindi_MA_16hindihindihi_IN16 kHzMedia Audio219Hindi Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 83 , Mies 309, Tuntematon 0
PuheHeprea_MA_16HepreaHepreahän_IL16 kHzMedia Audio427Heprea Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 361 , Mies 513, Tuntematon 13
PuheHeprea_Yleinen keskustelu_8HepreaHepreahän_IL8 kHzYleinen keskustelu399Heprean yleiset keskustelutiedotKäsikirjoittamaton puhelinkeskustelu kahden ihmisen välillä. Noin Äänen kesto (alue) - 15-60 minuuttia, heprea IsraelissaDualpöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 414 , Mies 399 , Tuntematon 1
PuheGujarati_MAgujaratigujarati (putkissa) gu_INMedia Audio40Gujarati (In Pipeline) Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheGujarati_GCgujaratigujarati (putkissa) gu_INYleinen keskustelu100Gujarati (In Pipeline) Yleiset keskustelutiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
PuheGujarati_CC_8gujaratigujarati (putkissa) gu_INPuhelinkeskus60Gujarati (In Pipeline) Call-Centerin tiedotKäsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,pöytä-5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Puhesaksalainen_IVR_8SaksanSaksande-De8 kHz IVR200Saksan IVR-tiedotIhmisestä koneelle. IVR-tyyppinen virtaus, jossa on TTS-kehote (esim. "Kuinka voin auttaa sinua"), jota seuraa spontaani ihmisen vastausMonopöytä-. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Nainen 10115 Mies 8750 Tuntematon 0
Puhesaksalainen_CC_8SaksanSaksande-De8 kHzPuhelinkeskus64Saksan puhelinkeskuksen tiedot Käsikirjoittamaton, synteettinen puhelinkeskustelu "agentin" ja "asiakkaan" välillä, n. Äänen kesto (alue) 5-15 minuuttia,Monopöytä-. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 478 Mies 1440 Tuntematon 0
PuheEnglanti syvä etelä_MA_16Englanti Deep SouthEnglanti Deep Southfi16 kHzMedia Audio266Englanti Deep South Median äänidataLisensoitavat julkiset ääni-/videotiedostot, kuten haastattelut, podcastit jne. - 1-5 henkilöä. Noin Äänen kesto (alue) 15-60 minuuttiaMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingNainen 204, mies 356, tuntematon 21

Tarjottu palvelu

Asiantunteva audiodatan kerääminen ei ole käytännössä käytännössä kattavia tekoälyasetuksia varten. Shaipissa voit jopa harkita seuraavia palveluita, jotta mallit yleistyisivät tavallista enemmän:

Tekstin tiedonkeruu

Tekstidatan kerääminen
Palvelut

Shaipin kognitiivisten tiedonkeruupalvelujen todellinen arvo on se, että se antaa organisaatioille avaimen jäsentämättömien tietojen sisältämien tärkeiden tietojen avaamiseen

Kuvatietojen kerääminen

Kuvatiedonkeruupalvelut

Varmista, että tietokonenäkömallasi tunnistaa kaikki kuvat tarkasti, jotta voit kouluttaa saumattomasti tulevan sukupolven tekoälymalleja

Videotietojen kerääminen

Videotiedonkeruupalvelut

Keskity nyt tietokonenäköön yhdessä NLP: n kanssa, jotta voit opettaa mallejasi tunnistamaan esineitä, yksilöitä, pelotteita ja muita visuaalisia elementtejä täydellisesti

Shaip ota yhteyttä

Haluatko rakentaa oman äänitietojoukon?

Ota yhteyttä talon sisäiseen puhetiedonkeruuasiantuntijaamme luodaksesi vaatimuksiasi parhaiten vastaavan äänivaraston

  • Rekisteröitymällä olen samaa mieltä Shaipin kanssa Tietosuojakäytäntö ja Käyttöehdot ja annan suostumukseni B2B-markkinointiviestinnän vastaanottamiseen Shaipilta.

Puhetietojen kerääminen ML-mallia varten viittaa puhekielen äänitallenteiden keräämiseen. Tämä kokoelma auttaa koneoppimisalgoritmien koulutuksessa ja jalostuksessa, erityisesti sellaisia, jotka keskittyvät ihmisäänien ymmärtämiseen ja käsittelyyn.

Kun pyrit keräämään äänidataa automaattista puheentunnistusta (ASR) varten, sinun tulee aloittaa määrittelemällä projektisi erityistarpeet, mukaan lukien haluttu kieli, aksentti ja puhetyyppi. Kun olet asettanut nämä parametrit, varmista, että hankit kaikki tarvittavat luvat käyttäjien yksityisyyden kunnioittamiseksi. Käytä sitten asianmukaisia ​​tallennuslaitteita tai ohjelmistoja selkeiden ääninäytteiden kaappaamiseen. Jokaiseen tallenteeseen on merkittävä huolellisesti sen transkriptio tai muut asiaankuuluvat metatiedot ja ne on tallennettava järjestelmällisesti vaivattoman käytön varmistamiseksi.

Koneoppimisen puhetietojoukko on keskeisessä asemassa puhutun kielen tunnistamiseen, litteroimiseen tai tulkitsemiseen räätälöityjen mallien koulutuksessa, testaamisessa ja validoinnissa. Tällaiset tietojoukot tasoittavat tietä lukemattomille sovelluksille puheavustajista ja transkriptiopalveluista puhebiometriaan.

Tarkkojen tietojen keräämiseksi eri kielistä ja aksenteista yhteistyö halutun kielitaustan omaavien äidinkielenään puhuvien kanssa on elintärkeää. Pyri monipuoliseen ja edustavaan otokseen, joka kattaa laajan kirjon demografisia vivahteita. Käytä standardoituja tallennuslaitteita yhtenäisissä ympäristöissä äänen yhtenäisyyden varmistamiseksi. Ja mikä tärkeintä, merkitse jokainen tietopala yksityiskohtaisilla transkriptioilla ja metatiedoilla, jotka ilmaisevat tietyn kielen ja aksentin.