Nyt hanki 50 % alennus* Conversational AI Off-the-Shelf -tietojoukoissa

Puhe- ja äänitietojoukko chatboteille, ääniavustajille ja puheen yhteytetyille laitteille.

*Rajoitetun ajan tarjous

  • Rekisteröitymällä olen samaa mieltä Shaipin kanssa Tietosuojakäytännön ja Käyttöehdot ja annan suostumukseni B2B-markkinointiviestinnän vastaanottamiseen Shaipilta.

Alan johtajat luottavat

LisätiedotValmis kielitietojoukkoPuhelinkeskuksen keskustelut 8 khz*Yleiset keskustelut 8 khz*Media ja podcastit 16 khz*Lause / käsikirjoitettu monologi 16 khz*Kokonaismäärä tunteinaMurteet katettuAudio FormatTekstin transkriptiomuotoKäytä asiaalähdeCTA
PuheafrikaansAfrikaans Audio Dataset6009001500Afrikaansia puhutaan Afrikassa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheArabialainenArabialainen äänitietojoukko80015002300Arabia Persianlahden maista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheKiinan kieliKiinan äänitiedostot20002000Kiinalaiset Kiinasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheTanskan kieliTanskan äänitiedostot40060020003000tanskalainen Tanskasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheDutchHollantilainen äänitiedosto20002000hollantilainen Hollannista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
Puheenglanti - AAVE AccentEnglanti - AAVE (Afro-Amerikan kansankielinen englanti) Audio Dataset5005001000Kansankielinen lajike (tunnetaan joskus nimellä AAVE, jota tyypillisesti puhuu valtaosa työväen- ja keskiluokan afrikkalaisista amerikkalaisista) ja tavallisempi lajike (jota tavallisesti puhuvat keskiluokan afrikkalaiset amerikkalaiset muodollisissa ja julkisissa tilanteissa), mutta voimakkaammin painotettuna kansankielellä.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - Boston/New York AccentEnglanti - Boston/New York Audio Dataset225225350800Tämä on kokoelma useita alueellisia aksentteja, joita puhutaan Bostonin, New Yorkin ja Philadelphian kaupungeissa ja niiden ympäristössä. Nämä aksentit saattavat kuulostaa muilta kuin paikallisilta, mutta eroavat muista amerikkalaisista aksenteista. Huolimatta paikallisesta sanastosta, joka eroaa muista englanninkielisen maailman osista, nämä aksentit ovat toisiaan ymmärrettävissä muualla puhutun englannin kanssa.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - kiina aksenttiEnglanti - kiina aksenttinen äänitiedosto150300450Puhujat, jotka puhuvat kiinaa äidinkielenään ja jotka muuttivat/muuttivat Yhdysvaltoihin teini-ikäisinä/aikuisina ja oppivat englantia toisena kielekseen.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
Puheenglanti - syvä eteläinen aksenttienglanti - Deep South Audio Dataset2752754501000Kaiuttimet (i) Texasista; (ii) Pohjois-Carolina, Etelä-Carolina, Georgia; (iii) New Orleans; (iv) Florida-panhandle; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
Puheenglanti - latinalaisamerikkalainen aksenttienglanti - latinalaisamerikkalainen aksenttinen äänitiedosto400400800Latinalaisella englanninkielisellä englanninkielisellä englanninkielisellä kielillä tarkoitetaan latinalaisamerikkalaisten, joilla on monipuolinen kansallinen perintö, puhumia amerikkalaisen englannin kieliä. Pääpaino oli meksikolaisissa amerikkalaisissa, jotka ovat eri kansallista alkuperää (esim. Meksiko, Puerto Rico, Dominikaaninen tasavalta, Ecuador, Kuuba jne.) ja myös eri alueilta (esim. Kalifornia, New York, Florida) puhuvia. Mukana olivat puhujat, jotka puhuvat espanjaa ensimmäisenä kielenä, sekä espanjalaista alkuperää olevat puhujat, jotka puhuvat espanjaa, jolla on perintökieli.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - Uusi-Seelanti AccentSuomi - Uusi-Seelanti Audio Dataset2507501000Kaiuttimet molemmilla saarilla, mukaan lukien sekoitus nuorempia kaiuttimia (<40-vuotiaita) ja vanhempia kaiuttimia (>40-vuotiaita) yhtä suuressa suhteessa.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
Puheenglanti - Singaporen aksenttienglanti - Singaporen äänitiedosto4006001000Sekä tavallinen Singaporen englanti että puhekieli Singaporen englanti. Singaporelaiset, joilla on eri etninen tausta (esim. kiina, malaiji, intialainen jne.) ja eri koulutustasoja.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - Etelä-Afrikka AksenttiEnglanti - Etelä-Afrikka Audio Dataset4006001000Edustajia eri sosioekonomisista luokista ja etnologisista taustoista (esim. eteläafrikkalaisia ​​eurooppalaisia, afrikkalaisia, intialaisia ​​tai sekataustaisia).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - irlantilainen aksenttiEnglanti - Irlantilainen äänitiedosto500500Englantia puhutaan Irlannissa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
Puheenglanti - skotlantilainen aksenttienglanti - Scottish Audio Dataset800800Englanti puhuu skotlantia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglanti - Walesin aksenttienglanti - Walesin äänitiedosto800800Walesin englanti. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheRanskalainen kanadalainenKanadan ranskalainen äänitiedosto10001000Kanadan ranska. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheHepreaHeprean äänitiedosto7507501500Heprea Israelissa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheIndonesialainenIndonesian äänitietojoukko100010002000indonesialainen kieli. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheJapanilainenJapanilainen äänitiedosto20002000Japanilainen Japanista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheKoreanKorean äänitiedostot10020015001800Kaiuttimet levisivät ympäri Etelä-Koreaa.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheMalayMalaijin äänitietojoukko5005001000Malaiji Malesiassa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheMeksikon espanjaMeksikon espanjan äänitiedostot12501250Meksikolainen Meksikosta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheKiillottaaPuolan äänitiedosto25020002250Puolalainen Puolasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheVenäläinenVenäjän äänitiedostot20002000Venäläinen Venäjältä. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheSuahiliSwahili-äänitietojoukko3506501000Etelä-Afrikan ja Kenian swahili. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheverkkokauppaRuotsin äänitiedosto3506501000ruotsi Ruotsissa. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheTaiwan kiinalainenTaiwanin kiinalainen äänitiedosto10001000Kiinalainen Taiwanista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheThaiThaimaan äänitiedostot350450800Epävirallinen rekisteri, jota käytetään ystävien kesken,. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheturkkiTurkin äänitiedosto20002000Turkki Turkista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhevietnamVietnamilainen äänitietojoukko6004001000Pohjoinen (esim. Hanoi), keskiosa ja etelä (esim. Ho Chi Minh City).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhehindiHindi-äänitietojoukko80020002800Hindi Intiassa erityisesti pohjoisen, idän ja lännen alueilla. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheHinglishIntian englannin äänitietojoukko300500800Kerätty Intian kaupunkikaupungeista, jotka ovat maan rahoituskeskuksia kasvavien taloudellisten mahdollisuuksien vuoksi. Tällaisia ​​paikkoja voivat olla Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad jne.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheEnglantiEnglanninkielinen äänitiedosto700700. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhekannadaKannada Audio Dataset6010040200Kannada Intian Karnatakasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhemalajalamMalayalam Audio Dataset6010040200Malayalam Keralasta, Lakshadweepistä ja Puducherrystä. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheOriyaOriya Audio Dataset6010040200Oriya Odishan, Länsi-Bengalin, Jharkhandin ja Chhattisgarhin osista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhepunjabiPunjabi-äänitietojoukko6010040200Punjabi Intian Punjabista. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhetamilTamil Audio Dataset60100240400Tamil Tamil Nadusta Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheteluguTelugu Audio Dataset1009509502000Telugu Andhra Pradeshista Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheBengaliBengali-äänitietojoukko6010040200Bengali Länsi-Bengalista Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhegujaratiGujarati-äänitietojoukko6010040200Gujarati Gujaratista Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuhemarathiMarathi Audio Dataset6010040200Marathi Maharashtrasta Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
PuheassamiAssamilainen äänitietojoukko6010040200Assami Assamista, Intiasta. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip

Syvä asiantuntemus keskustelutaidossa

Keskustelutekoäly tai chatbotit tai virtuaaliset/digitaaliset avustajat ovat vain yhtä älykkäitä kuin niiden takana oleva tekniikka ja data. Shaip tarjoaa sinulle laajan joukon monipuolisia äänitietojoukkoja Natural Language Processing (NLP) -käsittelyä varten, joka jäljittelee keskusteluja oikeiden ihmisten kanssa ja antaa sinun herättää tekoälysi henkiin. Syvällä ymmärryksemme avulla autamme sinua rakentamaan ja lokalisoimaan tekoälyä tukevia puhemalleja äärimmäisen tarkasti monipuolisilla ja jäsennellyillä tietojoukoilla useilla kielillä eri puolilta maailmaa. Tarjoamme monikielisiä äänikokoelma-, äänitranskriptio- ja äänimerkintäpalveluita tarpeidesi mukaan samalla kun räätälöimme täysin halutun tarkoituksen, lausunnot ja demografisen jakelun.

Kirjoitettu puhekokoelma

Spontaani puhekokoelma

Äänidatan transkriptio

Tietojen merkitseminen ja merkinnät

Shaipin avulla voit kouluttaa Conversational AI Platformia tarkasti, jotta se voi:

  • Puhu, tekstaa ja chattaile saumattomasti useiden kanavien kautta.
  • Opi olemassa olevista vuorovaikutuksista chatin, puhetranskriptien, tapahtumien jne. muodossa ja ehdota ja keskustele näiden oppien perusteella.
  • Ymmärrä ihmisten puheen taustalla oleva tarkoitus ja poista epäselvyydet ihmisten kielen ymmärtämisestä.
  • Ole vuorovaikutuksessa kanssasi henkilökohtaisesti, ja sinut voidaan kouluttaa tunnistamaan käyttäjiä ja muistamaan aiemmat keskustelut.

Maailman johtava keskustelutaidon koulutusdata

Tunnit audiodataa yli 100 kielellä - hankittu, transkriptoitu ja kommentoitu

Puhedatan lisensointi

20k + tuntia puhedataa yli 40 kielellä ja murteilla, jotka kattavat yli 55 aihetta eri toimialueilta, esim. Puhelukeskus, keskustelut, yleiset keskustelut, puheet, podcastit jne.

Puhetietojen keruu

Kerää ääni- ja puhetietoja (monologi, kahden hengen keskustelu, ihmisen ja botin välinen chat) yli 2 kielellä ympäri maailmaa, räätälöityä tekoälyn vaatimuksiin.

Puhedatan transkriptio

Kustannustehokas äänen transkriptio tai äänikommentointi 30,000 yhteistyökumppanin vahvan työvoiman avulla taatulla TAT: lla, tarkkuudella ja säästöillä

Nopeuta keskusteluaiheisen sovelluksen kehittämistä äänikokoelma- ja äänikommentointipalveluilla

Shaip-etu

Mittakaava

Voimme hankkia, skaalata ja toimittaa äänitietoja eri puolilta maailmaa useilla kielillä ja murteilla tarpeidesi mukaan.

asiantuntemus

Meillä on oikea asiantuntemus tarkasta ja puolueettomasta tiedonkeräämisestä, transkriptiosta ja kulta-standardin mukaisesta merkinnästä.

verkko

Verkosto, joka koostuu yli 30,000 pätevästä avustajasta, joille voidaan nopeasti antaa tiedonkeruutehtäviä tekoälyn koulutusmallin ja laajennuspalvelujen rakentamiseksi.

Elektroniikka

Meillä on täysin tekoälypohjainen alusta, jolla on omat työkalut ja prosessit työnkulun hallinnan hyödyntämiseksi 24 * 7 ympäri vuorokauden.

Ketteryys

Sopeudumme asiakkaiden vaatimusten muutoksiin erittäin nopeasti ja autamme nopeuttamaan tekoälyn kehittämistä laadukkaalla puhedatalla 5-10 kertaa kilpailua nopeammin.

Turvallisuus

Annamme äärimmäisen tärkeän tietoturvalle ja yksityisyydelle, ja meillä on myös sertifikaatti käsitellä erittäin säänneltyjä arkaluonteisia tietoja.

Mitä teemme parhaiten

Harjoittelutiedot

Saat laadukkaimmat merkityt tiedot murto-osassa aikaa. Se on kulta-standardi, luotettava ja valmis kouluttamaan AI- ja ML-mallejasi saavuttamaan korkeimman suorituskyvyn.

Lisätietoja

Tiedonkeruu, merkinnät ja merkinnät

Shaipin avulla saat yli 15 vuoden todistetun asiantuntemuksen laadukkaan tiedon keräämisestä, litteroinnista ja merkinnöistä. Maailmanlaajuisen työvoimamme avulla voimme kerätä tietoja eri puolilta maailmaa ja tarjota sitten merkintä- ja merkintäpalveluita täydellisellä taitotasolla ja tietojesi edellyttämällä asiantuntemuksella.

Lisätietoja

Tietoluettelot ja lisensointi

Miljoonien tietojoukkojen laajan valikoimamme avulla voit kerätä ja järjestää tarpeen mukaan. Voimme sitten lisensoida nämä laatutiedot AI- ja ML-käyttövaatimuksiasi varten. Lisäksi nämä tiedot ovat saatavilla murto-osalla hinnasta, jos luot ne itse.

Lisätietoja

Haluatko rakentaa oman tietojoukon?

Ota yhteyttä nyt saadaksesi lisätietoja siitä, kuinka voimme kerätä mukautetun tietojoukon ainutlaatuista tekoälyratkaisuasi varten.