Nyt hanki 50 % alennus* Conversational AI Off-the-Shelf -tietojoukoissa
Puhe- ja äänitietojoukko chatboteille, ääniavustajille ja puheen yhteytetyille laitteille.
*Rajoitetun ajan tarjous
Alan johtajat luottavat
Lisätiedot | avainsana | Valmis kielitietojoukko | Puhelinkeskuksen keskustelut 8 khz* | Yleiset keskustelut 8 khz* | Media ja podcastit 16 khz* | Lause / käsikirjoitettu monologi 16 khz* | Kokonaismäärä tunteina | Murteet katettu | Audio Format | Tekstin transkriptiomuoto | Käytä asiaa | lähde | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
afrikaans | Afrikaans Audio Dataset | 600 | 900 | 1500 | Afrikaansia puhutaan Afrikassa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Arabialainen | Arabialainen äänitietojoukko | 800 | 1500 | 2300 | Arabia Persianlahden maista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Kiinan kieli | Kiinan äänitiedostot | 2000 | 2000 | Kiinalaiset Kiinasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Tanskan kieli | Tanskan äänitiedostot | 400 | 600 | 2000 | 3000 | tanskalainen Tanskasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
Dutch | Hollantilainen äänitiedosto | 2000 | 2000 | hollantilainen Hollannista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
englanti - AAVE Accent | Englanti - AAVE (Afro-Amerikan kansankielinen englanti) Audio Dataset | 500 | 500 | 1000 | Kansankielinen lajike (tunnetaan joskus nimellä AAVE, jota tyypillisesti puhuu valtaosa työväen- ja keskiluokan afrikkalaisista amerikkalaisista) ja tavallisempi lajike (jota tavallisesti puhuvat keskiluokan afrikkalaiset amerikkalaiset muodollisissa ja julkisissa tilanteissa), mutta voimakkaammin painotettuna kansankielellä. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Englanti - Boston/New York Accent | Englanti - Boston/New York Audio Dataset | 225 | 225 | 350 | 800 | Tämä on kokoelma useita alueellisia aksentteja, joita puhutaan Bostonin, New Yorkin ja Philadelphian kaupungeissa ja niiden ympäristössä. Nämä aksentit saattavat kuulostaa muilta kuin paikallisilta, mutta eroavat muista amerikkalaisista aksenteista. Huolimatta paikallisesta sanastosta, joka eroaa muista englanninkielisen maailman osista, nämä aksentit ovat toisiaan ymmärrettävissä muualla puhutun englannin kanssa. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
Englanti - kiina aksentti | Englanti - kiina aksenttinen äänitiedosto | 150 | 300 | 450 | Puhujat, jotka puhuvat kiinaa äidinkielenään ja jotka muuttivat/muuttivat Yhdysvaltoihin teini-ikäisinä/aikuisina ja oppivat englantia toisena kielekseen. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
englanti - syvä eteläinen aksentti | englanti - Deep South Audio Dataset | 275 | 275 | 450 | 1000 | Kaiuttimet (i) Texasista; (ii) Pohjois-Carolina, Etelä-Carolina, Georgia; (iii) New Orleans; (iv) Florida-panhandle; (v) Tennessee, Arkansas, Michigan. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
englanti - latinalaisamerikkalainen aksentti | englanti - latinalaisamerikkalainen aksenttinen äänitiedosto | 400 | 400 | 800 | Latinalaisella englanninkielisellä englanninkielisellä englanninkielisellä kielillä tarkoitetaan latinalaisamerikkalaisten, joilla on monipuolinen kansallinen perintö, puhumia amerikkalaisen englannin kieliä. Pääpaino oli meksikolaisissa amerikkalaisissa, jotka ovat eri kansallista alkuperää (esim. Meksiko, Puerto Rico, Dominikaaninen tasavalta, Ecuador, Kuuba jne.) ja myös eri alueilta (esim. Kalifornia, New York, Florida) puhuvia. Mukana olivat puhujat, jotka puhuvat espanjaa ensimmäisenä kielenä, sekä espanjalaista alkuperää olevat puhujat, jotka puhuvat espanjaa, jolla on perintökieli. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Englanti - Uusi-Seelanti Accent | Suomi - Uusi-Seelanti Audio Dataset | 250 | 750 | 1000 | Kaiuttimet molemmilla saarilla, mukaan lukien sekoitus nuorempia kaiuttimia (<40-vuotiaita) ja vanhempia kaiuttimia (>40-vuotiaita) yhtä suuressa suhteessa. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
englanti - Singaporen aksentti | englanti - Singaporen äänitiedosto | 400 | 600 | 1000 | Sekä tavallinen Singaporen englanti että puhekieli Singaporen englanti. Singaporelaiset, joilla on eri etninen tausta (esim. kiina, malaiji, intialainen jne.) ja eri koulutustasoja. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Englanti - Etelä-Afrikka Aksentti | Englanti - Etelä-Afrikka Audio Dataset | 400 | 600 | 1000 | Edustajia eri sosioekonomisista luokista ja etnologisista taustoista (esim. eteläafrikkalaisia eurooppalaisia, afrikkalaisia, intialaisia tai sekataustaisia). | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Englanti - irlantilainen aksentti | Englanti - Irlantilainen äänitiedosto | 500 | 500 | Englantia puhutaan Irlannissa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
englanti - skotlantilainen aksentti | englanti - Scottish Audio Dataset | 800 | 800 | Englanti puhuu skotlantia | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Englanti - Walesin aksentti | englanti - Walesin äänitiedosto | 800 | 800 | Walesin englanti | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Ranskalainen kanadalainen | Kanadan ranskalainen äänitiedosto | 1000 | 1000 | Kanadan ranska | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Heprea | Heprean äänitiedosto | 750 | 750 | 1500 | Heprea Israelissa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Indonesialainen | Indonesian äänitietojoukko | 1000 | 1000 | 2000 | indonesialainen kieli | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Japanilainen | Japanilainen äänitiedosto | 2000 | 2000 | Japanilainen Japanista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Korean | Korean äänitiedostot | 100 | 200 | 1500 | 1800 | Kaiuttimet levisivät ympäri Etelä-Koreaa. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
Malay | Malaijin äänitietojoukko | 500 | 500 | 1000 | Malaiji Malesiassa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Meksikon espanja | Meksikon espanjan äänitiedostot | 1250 | 1250 | Meksikolainen Meksikosta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Kiillottaa | Puolan äänitiedosto | 250 | 2000 | 2250 | Puolalainen Puolasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Venäläinen | Venäjän äänitiedostot | 2000 | 2000 | Venäläinen Venäjältä | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Suahili | Swahili-äänitietojoukko | 350 | 650 | 1000 | Etelä-Afrikan ja Kenian swahili | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
verkkokauppa | Ruotsin äänitiedosto | 350 | 650 | 1000 | ruotsi Ruotsissa | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Taiwan kiinalainen | Taiwanin kiinalainen äänitiedosto | 1000 | 1000 | Kiinalainen Taiwanista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
Thai | Thaimaan äänitiedostot | 350 | 450 | 800 | Epävirallinen rekisteri, jota käytetään ystävien kesken, | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
turkki | Turkin äänitiedosto | 2000 | 2000 | Turkki Turkista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||||
vietnam | Vietnamilainen äänitietojoukko | 600 | 400 | 1000 | Pohjoinen (esim. Hanoi), keskiosa ja etelä (esim. Ho Chi Minh City). | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
hindi | Hindi-äänitietojoukko | 800 | 2000 | 2800 | Hindi Intiassa erityisesti pohjoisen, idän ja lännen alueilla | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Hinglish | Intian englannin äänitietojoukko | 300 | 500 | 800 | Kerätty Intian kaupunkikaupungeista, jotka ovat maan rahoituskeskuksia kasvavien taloudellisten mahdollisuuksien vuoksi. Tällaisia paikkoja voivat olla Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad jne. | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||
Englanti | Englanninkielinen äänitiedosto | 700 | 700 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | |||||
kannada | Kannada Audio Dataset | 60 | 100 | 40 | 200 | Kannada Intian Karnatakasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
malajalam | Malayalam Audio Dataset | 60 | 100 | 40 | 200 | Malayalam Keralasta, Lakshadweepistä ja Puducherrystä | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
Oriya | Oriya Audio Dataset | 60 | 100 | 40 | 200 | Oriya Odishan, Länsi-Bengalin, Jharkhandin ja Chhattisgarhin osista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
punjabi | Punjabi-äänitietojoukko | 60 | 100 | 40 | 200 | Punjabi Intian Punjabista | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
tamil | Tamil Audio Dataset | 60 | 100 | 240 | 400 | Tamil Tamil Nadusta Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
telugu | Telugu Audio Dataset | 100 | 950 | 950 | 2000 | Telugu Andhra Pradeshista Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
Bengali | Bengali-äänitietojoukko | 60 | 100 | 40 | 200 | Bengali Länsi-Bengalista Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
gujarati | Gujarati-äänitietojoukko | 60 | 100 | 40 | 200 | Gujarati Gujaratista Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
marathi | Marathi Audio Dataset | 60 | 100 | 40 | 200 | Marathi Maharashtrasta Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä | ||
assami | Assamilainen äänitietojoukko | 60 | 100 | 40 | 200 | Assami Assamista, Intiasta | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Shaip | Ota yhteyttä Ota yhteyttä |
Syvä asiantuntemus keskustelutaidossa
Keskustelutekoäly tai chatbotit tai virtuaaliset/digitaaliset avustajat ovat vain yhtä älykkäitä kuin niiden takana oleva tekniikka ja data. Shaip tarjoaa sinulle laajan joukon monipuolisia äänitietojoukkoja Natural Language Processing (NLP) -käsittelyä varten, joka jäljittelee keskusteluja oikeiden ihmisten kanssa ja antaa sinun herättää tekoälysi henkiin. Syvällä ymmärryksemme avulla autamme sinua rakentamaan ja lokalisoimaan tekoälyä tukevia puhemalleja äärimmäisen tarkasti monipuolisilla ja jäsennellyillä tietojoukoilla useilla kielillä eri puolilta maailmaa. Tarjoamme monikielisiä äänikokoelma-, äänitranskriptio- ja äänimerkintäpalveluita tarpeidesi mukaan samalla kun räätälöimme täysin halutun tarkoituksen, lausunnot ja demografisen jakelun.
Kirjoitettu puhekokoelma
Spontaani puhekokoelma
Äänidatan transkriptio
Tietojen merkitseminen ja merkinnät
Shaipin avulla voit kouluttaa Conversational AI Platformia tarkasti, jotta se voi:
- Puhu, tekstaa ja chattaile saumattomasti useiden kanavien kautta.
- Opi olemassa olevista vuorovaikutuksista chatin, puhetranskriptien, tapahtumien jne. muodossa ja ehdota ja keskustele näiden oppien perusteella.
- Ymmärrä ihmisten puheen taustalla oleva tarkoitus ja poista epäselvyydet ihmisten kielen ymmärtämisestä.
- Ole vuorovaikutuksessa kanssasi henkilökohtaisesti, ja sinut voidaan kouluttaa tunnistamaan käyttäjiä ja muistamaan aiemmat keskustelut.
Maailman johtava keskustelutaidon koulutusdata
Tunnit audiodataa yli 100 kielellä - hankittu, transkriptoitu ja kommentoitu
Puhedatan lisensointi
20k + tuntia puhedataa yli 40 kielellä ja murteilla, jotka kattavat yli 55 aihetta eri toimialueilta, esim. Puhelukeskus, keskustelut, yleiset keskustelut, puheet, podcastit jne.
Puhetietojen keruu
Kerää ääni- ja puhetietoja (monologi, kahden hengen keskustelu, ihmisen ja botin välinen chat) yli 2 kielellä ympäri maailmaa, räätälöityä tekoälyn vaatimuksiin.
Puhedatan transkriptio
Kustannustehokas äänen transkriptio tai äänikommentointi 30,000 yhteistyökumppanin vahvan työvoiman avulla taatulla TAT: lla, tarkkuudella ja säästöillä
Nopeuta keskusteluaiheisen sovelluksen kehittämistä äänikokoelma- ja äänikommentointipalveluilla
Shaip-etu
Mittakaava
Voimme hankkia, skaalata ja toimittaa äänitietoja eri puolilta maailmaa useilla kielillä ja murteilla tarpeidesi mukaan.
asiantuntemus
Meillä on oikea asiantuntemus tarkasta ja puolueettomasta tiedonkeräämisestä, transkriptiosta ja kulta-standardin mukaisesta merkinnästä.
verkko
Verkosto, joka koostuu yli 30,000 pätevästä avustajasta, joille voidaan nopeasti antaa tiedonkeruutehtäviä tekoälyn koulutusmallin ja laajennuspalvelujen rakentamiseksi.
Elektroniikka
Meillä on täysin tekoälypohjainen alusta, jolla on omat työkalut ja prosessit työnkulun hallinnan hyödyntämiseksi 24 * 7 ympäri vuorokauden.
Ketteryys
Sopeudumme asiakkaiden vaatimusten muutoksiin erittäin nopeasti ja autamme nopeuttamaan tekoälyn kehittämistä laadukkaalla puhedatalla 5-10 kertaa kilpailua nopeammin.
Turvallisuus
Annamme äärimmäisen tärkeän tietoturvalle ja yksityisyydelle, ja meillä on myös sertifikaatti käsitellä erittäin säänneltyjä arkaluonteisia tietoja.
Mitä teemme parhaiten
Harjoittelutiedot
Saat laadukkaimmat merkityt tiedot murto-osassa aikaa. Se on kulta-standardi, luotettava ja valmis kouluttamaan AI- ja ML-mallejasi saavuttamaan korkeimman suorituskyvyn.
Tiedonkeruu, merkinnät ja merkinnät
Shaipin avulla saat yli 15 vuoden todistetun asiantuntemuksen laadukkaan tiedon keräämisestä, litteroinnista ja merkinnöistä. Maailmanlaajuisen työvoimamme avulla voimme kerätä tietoja eri puolilta maailmaa ja tarjota sitten merkintä- ja merkintäpalveluita täydellisellä taitotasolla ja tietojesi edellyttämällä asiantuntemuksella.
Tietoluettelot ja lisensointi
Miljoonien tietojoukkojen laajan valikoimamme avulla voit kerätä ja järjestää tarpeen mukaan. Voimme sitten lisensoida nämä laatutiedot AI- ja ML-käyttövaatimuksiasi varten. Lisäksi nämä tiedot ovat saatavilla murto-osalla hinnasta, jos luot ne itse.
Haluatko rakentaa oman tietojoukon?
Ota yhteyttä nyt saadaksesi lisätietoja siitä, kuinka voimme kerätä mukautetun tietojoukon ainutlaatuista tekoälyratkaisuasi varten.