Pankkisekkitietojoukko (asiakirja AI)

Pankkisekkitietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg

Count: 2023

Huomautukset: Ei

X

Kuvaus: Pankkisekkitietosarja (Document AI): Synteettiset pankkisekit koostuvat keinotekoisesti luoduista sekkikuvista, jotka on suunniteltu jäljittelemään oikeiden shekkien ulkoasua ja sisältöä. Se sisältää erilaisia ​​elementtejä, kuten maksunsaajien nimet, summat, päivämäärät, allekirjoitukset ja sekkien numerot. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tarkistusten käsittely ja automaattinen tietojen poimiminen, mikä tarjoaa hallitun ympäristön mallien kehittämiseen ilman todellisten shekkien yksityisyyttä koskevia huolenaiheita.

Tallennusolosuhteet: - Napsautetut kuvat - Skannatut - Web scrapper

Pankkitiliotteen tietojoukko (asiakirja AI)

Pankkitiliotteen tietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg, png

Count: 5366

Huomautukset: Ei

X

Kuvaus: Tiliotteen tietojoukko (Document AI): Synteettiset tiliotteet sisältävät keinotekoisesti luotuja tiliotteita, jotka on suunniteltu simuloimaan todellisia talousasiakirjoja. Se sisältää erilaisia ​​tapahtumatietueita, päivämääriä, summia ja tilitietoja, jotka on rakennettu peilaamaan todellisia muotoja ja sisältöä. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tietojen poiminta ja dokumenttianalyysi, mikä tarjoaa valvotun ympäristön ilman todellisten taloustietojen yksityisyysongelmia.

Tallennusolosuhteet: - Skannattu - Pankkitiliote - Web scrapper

Kiinan laskujen tietojoukko

Kiinan laskujen tietojoukko

Käyttötapa: OCR

Format: Kuva

Count: 6k

Huomautukset: Kyllä

X

Kuvaus: Chinese Bills Dataset sisältää kuvia tai tekstinäytteitä erityyppisistä laskuista, kuten laskuista, kuiteista ja tiliotteista, jotka on kirjoitettu kiinaksi. Siinä on erilaisia ​​muotoja ja sisältöä, mukaan lukien nimikkeiden kuvaukset, määrät ja päivämäärät. Tätä tietojoukkoa käytetään tehtäviin, kuten optiseen merkintunnistukseen (OCR), talousasiakirjojen käsittelyyn ja automaattiseen tietojen poimimiseen.

Dokumentit / OCR – arabian- ja englanninkielinen OCR-sisältöaineisto

Dokumentit / OCR – arabian- ja englanninkielinen OCR-sisältöaineisto

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 1,321

Huomautukset: Ei

X

Kuvaus: Arabian- ja englanninkielisen sisällön kuvakokoelma: kuva + merkinnät OCR:ään

Dokumentit / OCR – Viivakoodivideoiden tietojoukko

Dokumentit / OCR – Viivakoodivideoiden tietojoukko

Käyttötapa: Asiakirjat / OCR

Format: Videoita

Count: 2,767

Huomautukset: Ei

X

Kuvaus: Viivakoodivideot (Code128, UPC/EAN, PDF417, Aztec, Multi-code)

Dokumentit / OCR – Kaarevan tulostetun tekstin tietojoukko

Dokumentit / OCR – Kaarevan tulostetun tekstin tietojoukko

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 18,986

Huomautukset: Ei

X

Kuvaus: Kaareva painettu teksti: Kerää kuvia, joissa on kaarevaa tekstiä tai tekstiä, jonka perusviiva on epälineaarinen.

Asiakirjat / OCR – Taloudelliset asiakirjat (pankki, palkkakuitti, vero, Yhdysvallat)

Asiakirjat / OCR – Taloudelliset asiakirjat (pankki, palkkakuitti, vero, Yhdysvallat)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 26,446

Huomautukset: Ei

X

Kuvaus: Taloudelliset asiakirjat: tiliote, sekki, palkkalaskelma, vero, asuntolaina, vakuutuskorvaukset (Yhdysvallat)

Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 1 – Asuntolaina)

Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 1 – Asuntolaina)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 9,192

Huomautukset: Ei

X

Kuvaus: Taloudelliset asiakirjat (vaihe 1) Asuntolaina-aineisto – tulostus, skannaus, valokuva

Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 2 – Vakuutus)

Asiakirjat / OCR – Taloudelliset asiakirjat (Vaihe 2 – Vakuutus)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 7,636

Huomautukset: Ei

X

Kuvaus: Taloudelliset asiakirjat (vaihe 2) Vakuutusaineisto – tulostus, skannaus, valokuva

Asiakirjat / OCR – käsinkirjoitetun tekstin tietojoukko (JP/KR/RU)

Asiakirjat / OCR – käsinkirjoitetun tekstin tietojoukko (JP/KR/RU)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 106,313

Huomautukset: Ei

X

Kuvaus: Käsin kirjoitettu teksti: LivePhotos käsin kirjoitetulla tekstillä (japani, korea, venäjä)

Dokumentit / OCR – Laskutietojoukko rajaavan laatikon merkinnöillä

Dokumentit / OCR – Laskutietojoukko rajaavan laatikon merkinnöillä

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 87

Huomautukset: Kyllä

X

Kuvaus: Laskutietojoukko, jossa on rajaavia laatikoita, sisältää skannattuja tai digitaalisia laskuja, joissa keskeiset kentät, kuten laskun numero, päivämäärä, toimittajan tiedot, rivit ja kokonaissummat, on merkitty rajaavilla laatikoilla, joiden avulla tekoälymallit voivat havaita ja poimia strukturoitua tietoa tarkasti strukturoimattomista asiakirjoista.

Dokumentit / OCR – LivePhotos-kuvat painetulla tekstillä (JP/KR/RU)

Dokumentit / OCR – LivePhotos-kuvat painetulla tekstillä (JP/KR/RU)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 4,944

Huomautukset: Ei

X

Kuvaus: LivePhotos-kuvaukset painetulla tekstillä (japaniksi, koreaksi, venäjäksi)

Dokumentit / OCR – Monikielinen kuitti-/laskuaineisto

Dokumentit / OCR – Monikielinen kuitti-/laskuaineisto

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 8,961

Huomautukset: Ei

X

Kuvaus: Monikielinen kuitti- ja laskuaineisto sisältää erilaisia ​​talousasiakirjoja useilla kielillä, minkä ansiosta tekoälymallit voivat kouluttaa kielten välistä tekstintunnistusta, avainkenttien poimintaa ja asiakirjojen ymmärtämistä.

Asiakirjat / OCR – Synteettiset tiliotteet (40 mallipohjaa)

Asiakirjat / OCR – Synteettiset tiliotteet (40 mallipohjaa)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 1,290

Huomautukset: Ei

X

Kuvaus: Pankkitiliotteet - Ainutlaatuinen mallipohja - 40: Synteettiset pankkitiliotteet

Asiakirjat / OCR – Synteettiset palkkalaskelmat (60 mallipohjaa)

Asiakirjat / OCR – Synteettiset palkkalaskelmat (60 mallipohjaa)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 2,010

Huomautukset: Ei

X

Kuvaus: Sekki - Yksilöllinen malli - 60: Keinotekoiset palkkalaskelmat

Asiakirjat / OCR – Synteettiset palkkalaskelmat (130 mallipohjaa)

Asiakirjat / OCR – Synteettiset palkkalaskelmat (130 mallipohjaa)

Käyttötapa: Asiakirjat / OCR

Format: kuvat

Count: 2,023

Huomautukset: Ei

X

Kuvaus: Palkkalaskelmat - Ainutlaatuinen malli - 130: Synteettinen pankkisekki

Palkkalaskujen tietojoukko (asiakirja AI)

Palkkalaskujen tietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg

Count: 2010

Huomautukset: Ei

X

Kuvaus: Palkkalaskujen tietojoukko (Document AI): Synteettiset palkkalaskelmat koostuvat kuvista keinotekoisesti luoduista palkkakuitteista ilman huomautuksia. Se sisältää erilaisia ​​palkkakuittimuotoja ja tietoja, kuten työntekijöiden nimet, palkat ja päivämäärät, joita käytetään Document AI -järjestelmien koulutukseen ja testaamiseen sellaisissa tehtävissä kuin tekstintunnistus ja asiakirjojen käsittely.

Tallennusolosuhteet: - Skannattu - Web scrapper