Pankkisekkitietojoukko (asiakirja AI)

Synteettinen pankkisekki

Pankkisekkitietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg

Count: 2023

Huomautukset: Ei

X

Kuvaus: Pankkisekkitietosarja (Document AI): Synteettiset pankkisekit koostuvat keinotekoisesti luoduista sekkikuvista, jotka on suunniteltu jäljittelemään oikeiden shekkien ulkoasua ja sisältöä. Se sisältää erilaisia ​​elementtejä, kuten maksunsaajien nimet, summat, päivämäärät, allekirjoitukset ja sekkien numerot. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tarkistusten käsittely ja automaattinen tietojen poimiminen, mikä tarjoaa hallitun ympäristön mallien kehittämiseen ilman todellisten shekkien yksityisyyttä koskevia huolenaiheita.

Tallennusolosuhteet: - Napsautetut kuvat - Skannatut - Web scrapper

Pankkitiliotteen tietojoukko (asiakirja AI)

Synteettiset tiliotteet

Pankkitiliotteen tietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg, png

Count: 5366

Huomautukset: Ei

X

Kuvaus: Tiliotteen tietojoukko (Document AI): Synteettiset tiliotteet sisältävät keinotekoisesti luotuja tiliotteita, jotka on suunniteltu simuloimaan todellisia talousasiakirjoja. Se sisältää erilaisia ​​tapahtumatietueita, päivämääriä, summia ja tilitietoja, jotka on rakennettu peilaamaan todellisia muotoja ja sisältöä. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tietojen poiminta ja dokumenttianalyysi, mikä tarjoaa valvotun ympäristön ilman todellisten taloustietojen yksityisyysongelmia.

Tallennusolosuhteet: - Skannattu - Pankkitiliote - Web scrapper

Kiinan laskujen tietojoukko

Rajauslaatikko+teksti

Kiinan laskujen tietojoukko

Käyttötapa: OCR

Format: Kuva

Count: 6k

Huomautukset: Kyllä

X

Kuvaus: Chinese Bills Dataset sisältää kuvia tai tekstinäytteitä erityyppisistä laskuista, kuten laskuista, kuiteista ja tiliotteista, jotka on kirjoitettu kiinaksi. Siinä on erilaisia ​​muotoja ja sisältöä, mukaan lukien nimikkeiden kuvaukset, määrät ja päivämäärät. Tätä tietojoukkoa käytetään tehtäviin, kuten optiseen merkintunnistukseen (OCR), talousasiakirjojen käsittelyyn ja automaattiseen tietojen poimimiseen.

Palkkalaskujen tietojoukko (asiakirja AI)

Palkkalaskujen tietojoukko (asiakirja AI)

Käyttötapa: OCR

Format: .jpg

Count: 2010

Huomautukset: Ei

X

Kuvaus: Palkkalaskujen tietojoukko (Document AI): Synteettiset palkkalaskelmat koostuvat kuvista keinotekoisesti luoduista palkkakuitteista ilman huomautuksia. Se sisältää erilaisia ​​palkkakuittimuotoja ja tietoja, kuten työntekijöiden nimet, palkat ja päivämäärät, joita käytetään Document AI -järjestelmien koulutukseen ja testaamiseen sellaisissa tehtävissä kuin tekstintunnistus ja asiakirjojen käsittely.

Tallennusolosuhteet: - Skannattu - Web scrapper

Painettu säännöllinen/kursiivinen tekstitietojoukko (Document AI)

Painettu säännöllinen/kursiivinen tekstitietojoukko (Document AI)

Käyttötapa: Asiakirja AI

Format: HEIC (kuvat) ja .mov (videot)

Count: 23930

Huomautukset: Ei

X

Kuvaus: Live-valokuvat käsinkirjoitetulla tekstillä japaniksi, koreaksi ja venäjäksi

Tallennuslaite: iPhone & iPad kamera

Tallennusolosuhteet: - Aggressiivinen valaistus/häikäisy - Kameran salama päällä - Värillinen valo - Hämärä, ei kameran salamaa - Normaali