Pankkisekkitietojoukko (asiakirja AI)
Synteettinen pankkisekki
Käyttötapa: OCR
Format: .jpg
Count: 2023
Huomautukset: Ei
Kuvaus: Pankkisekkitietosarja (Document AI): Synteettiset pankkisekit koostuvat keinotekoisesti luoduista sekkikuvista, jotka on suunniteltu jäljittelemään oikeiden shekkien ulkoasua ja sisältöä. Se sisältää erilaisia elementtejä, kuten maksunsaajien nimet, summat, päivämäärät, allekirjoitukset ja sekkien numerot. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tarkistusten käsittely ja automaattinen tietojen poimiminen, mikä tarjoaa hallitun ympäristön mallien kehittämiseen ilman todellisten shekkien yksityisyyttä koskevia huolenaiheita.
Tallennusolosuhteet: - Napsautetut kuvat - Skannatut - Web scrapper
Pankkitiliotteen tietojoukko (asiakirja AI)
Synteettiset tiliotteet
Käyttötapa: OCR
Format: .jpg, png
Count: 5366
Huomautukset: Ei
Kuvaus: Tiliotteen tietojoukko (Document AI): Synteettiset tiliotteet sisältävät keinotekoisesti luotuja tiliotteita, jotka on suunniteltu simuloimaan todellisia talousasiakirjoja. Se sisältää erilaisia tapahtumatietueita, päivämääriä, summia ja tilitietoja, jotka on rakennettu peilaamaan todellisia muotoja ja sisältöä. Tätä tietojoukkoa käytetään Document AI -järjestelmien koulutukseen ja arviointiin sellaisissa tehtävissä kuin optinen merkintunnistus (OCR), tietojen poiminta ja dokumenttianalyysi, mikä tarjoaa valvotun ympäristön ilman todellisten taloustietojen yksityisyysongelmia.
Tallennusolosuhteet: - Skannattu - Pankkitiliote - Web scrapper
Kiinan laskujen tietojoukko
Rajauslaatikko+teksti
Käyttötapa: OCR
Format: Kuva
Count: 6k
Huomautukset: Kyllä
Kuvaus: Chinese Bills Dataset sisältää kuvia tai tekstinäytteitä erityyppisistä laskuista, kuten laskuista, kuiteista ja tiliotteista, jotka on kirjoitettu kiinaksi. Siinä on erilaisia muotoja ja sisältöä, mukaan lukien nimikkeiden kuvaukset, määrät ja päivämäärät. Tätä tietojoukkoa käytetään tehtäviin, kuten optiseen merkintunnistukseen (OCR), talousasiakirjojen käsittelyyn ja automaattiseen tietojen poimimiseen.
Palkkalaskujen tietojoukko (asiakirja AI)
Käyttötapa: OCR
Format: .jpg
Count: 2010
Huomautukset: Ei
Kuvaus: Palkkalaskujen tietojoukko (Document AI): Synteettiset palkkalaskelmat koostuvat kuvista keinotekoisesti luoduista palkkakuitteista ilman huomautuksia. Se sisältää erilaisia palkkakuittimuotoja ja tietoja, kuten työntekijöiden nimet, palkat ja päivämäärät, joita käytetään Document AI -järjestelmien koulutukseen ja testaamiseen sellaisissa tehtävissä kuin tekstintunnistus ja asiakirjojen käsittely.
Tallennusolosuhteet: - Skannattu - Web scrapper
Painettu säännöllinen/kursiivinen tekstitietojoukko (Document AI)
Käyttötapa: Asiakirja AI
Format: HEIC (kuvat) ja .mov (videot)
Count: 23930
Huomautukset: Ei
Kuvaus: Live-valokuvat käsinkirjoitetulla tekstillä japaniksi, koreaksi ja venäjäksi
Tallennuslaite: iPhone & iPad kamera
Tallennusolosuhteet: - Aggressiivinen valaistus/häikäisy - Kameran salama päällä - Värillinen valo - Hämärä, ei kameran salamaa - Normaali