Pankkisekkitietojoukko (asiakirja AI)
Käyttötapa: OCR
Format: .jpg
Count: 2023
Huomautukset: Ei
Kuvaus: Pankkisekkitietosarja (Document AI): Synteettiset pankkisekit koostuvat keinotekoisesti luoduista sekkikuvista, jotka on suunniteltu jäljittelemään oikeiden shekkien ulkoasua ja sisältöä. Se sisältää erilaisia elementtejä, kuten maksunsaajien nimet, summat, päivämäärät, allekirjoitukset ja sekkien numerot. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tarkistusten käsittely ja automaattinen tietojen poimiminen, mikä tarjoaa hallitun ympäristön mallien kehittämiseen ilman todellisten shekkien yksityisyyttä koskevia huolenaiheita.
Tallennusolosuhteet: - Napsautetut kuvat - Skannatut - Web scrapper
Pankkitiliotteen tietojoukko (asiakirja AI)
Käyttötapa: OCR
Format: .jpg, png
Count: 5366
Huomautukset: Ei
Kuvaus: Tiliotteen tietojoukko (Document AI): Synteettiset tiliotteet sisältävät keinotekoisesti luotuja tiliotteita, jotka on suunniteltu simuloimaan todellisia talousasiakirjoja. Se sisältää erilaisia tapahtumatietueita, päivämääriä, summia ja tilitietoja, jotka on rakennettu peilaamaan todellisia muotoja ja sisältöä. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tietojen poiminta ja dokumenttianalyysi, mikä tarjoaa valvotun ympäristön ilman todellisten taloustietojen yksityisyysongelmia.
Tallennusolosuhteet: - Skannattu - Pankkitiliote - Web scrapper
Kiinan laskujen tietojoukko
Käyttötapa: OCR
Format: Kuva
Count: 6k
Huomautukset: Kyllä
Kuvaus: Chinese Bills Dataset sisältää kuvia tai tekstinäytteitä erityyppisistä laskuista, kuten laskuista, kuiteista ja tiliotteista, jotka on kirjoitettu kiinaksi. Siinä on erilaisia muotoja ja sisältöä, mukaan lukien nimikkeiden kuvaukset, määrät ja päivämäärät. Tätä tietojoukkoa käytetään tehtäviin, kuten optiseen merkintunnistukseen (OCR), talousasiakirjojen käsittelyyn ja automaattiseen tietojen poimimiseen.
Dokumentit / OCR – arabian- ja englanninkielinen OCR-sisältöaineisto
Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 1,321
Huomautukset: Ei
Kuvaus: Arabian- ja englanninkielisen sisällön kuvakokoelma: kuva + merkinnät OCR:ään
Dokumentit / OCR – Viivakoodivideoiden tietojoukko

Käyttötapa: Asiakirjat / OCR
Format: Videoita
Count: 2,767
Huomautukset: Ei
Kuvaus: Viivakoodivideot (Code128, UPC/EAN, PDF417, Aztec, Multi-code)
Dokumentit / OCR – Kaarevan tulostetun tekstin tietojoukko

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 18,986
Huomautukset: Ei
Kuvaus: Kaareva painettu teksti: Kerää kuvia, joissa on kaarevaa tekstiä tai tekstiä, jonka perusviiva on epälineaarinen.
Asiakirjat / OCR – Taloudelliset asiakirjat (pankki, palkkakuitti, vero, Yhdysvallat)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 26,446
Huomautukset: Ei
Kuvaus: Taloudelliset asiakirjat: tiliote, sekki, palkkalaskelma, vero, asuntolaina, vakuutuskorvaukset (Yhdysvallat)
Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 1 – Asuntolaina)
Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 9,192
Huomautukset: Ei
Kuvaus: Taloudelliset asiakirjat (vaihe 1) Asuntolaina-aineisto – tulostus, skannaus, valokuva
Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 2 – Vakuutus)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 7,636
Huomautukset: Ei
Kuvaus: Taloudelliset asiakirjat (vaihe 2) Vakuutusaineisto – tulostus, skannaus, valokuva
Asiakirjat / OCR – käsinkirjoitetun tekstin tietojoukko (JP/KR/RU)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 106,313
Huomautukset: Ei
Kuvaus: Käsin kirjoitettu teksti: LivePhotos käsin kirjoitetulla tekstillä (japani, korea, venäjä)
Dokumentit / OCR – Laskutietojoukko rajaavan laatikon merkinnöillä

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 87
Huomautukset: Kyllä
Kuvaus: Laskutietojoukko, jossa on rajaavia laatikoita, sisältää skannattuja tai digitaalisia laskuja, joissa keskeiset kentät, kuten laskun numero, päivämäärä, toimittajan tiedot, rivit ja kokonaissummat, on merkitty rajaavilla laatikoilla, joiden avulla tekoälymallit voivat havaita ja poimia strukturoitua tietoa tarkasti strukturoimattomista asiakirjoista.
Dokumentit / OCR – LivePhotos-kuvat painetulla tekstillä (JP/KR/RU)
Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 4,944
Huomautukset: Ei
Kuvaus: LivePhotos-kuvaukset painetulla tekstillä (japaniksi, koreaksi, venäjäksi)
Dokumentit / OCR – Monikielinen kuitti-/laskuaineisto

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 8,961
Huomautukset: Ei
Kuvaus: Monikielinen kuitti- ja laskuaineisto sisältää erilaisia talousasiakirjoja useilla kielillä, minkä ansiosta tekoälymallit voivat kouluttaa kielten välistä tekstintunnistusta, avainkenttien poimintaa ja asiakirjojen ymmärtämistä.
Asiakirjat / OCR – Synteettiset tiliotteet (40 mallipohjaa)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 1,290
Huomautukset: Ei
Kuvaus: Pankkitiliotteet - Ainutlaatuinen mallipohja - 40: Synteettiset pankkitiliotteet
Asiakirjat / OCR – Synteettiset palkkalaskelmat (60 mallipohjaa)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 2,010
Huomautukset: Ei
Kuvaus: Sekki - Yksilöllinen malli - 60: Keinotekoiset palkkalaskelmat
Asiakirjat / OCR – Synteettiset palkkalaskelmat (130 mallipohjaa)

Käyttötapa: Asiakirjat / OCR
Format: kuvat
Count: 2,023
Huomautukset: Ei
Kuvaus: Palkkalaskelmat - Ainutlaatuinen malli - 130: Synteettinen pankkisekki
Palkkalaskujen tietojoukko (asiakirja AI)

Käyttötapa: OCR
Format: .jpg
Count: 2010
Huomautukset: Ei
Kuvaus: Palkkalaskujen tietojoukko (Document AI): Synteettiset palkkalaskelmat koostuvat kuvista keinotekoisesti luoduista palkkakuitteista ilman huomautuksia. Se sisältää erilaisia palkkakuittimuotoja ja tietoja, kuten työntekijöiden nimet, palkat ja päivämäärät, joita käytetään Document AI -järjestelmien koulutukseen ja testaamiseen sellaisissa tehtävissä kuin tekstintunnistus ja asiakirjojen käsittely.
Tallennusolosuhteet: - Skannattu - Web scrapper

