Tietojen huomautus – NER

Nimetyn kokonaisuuden tunnistamisen (NER) merkintä kliiniselle NLP: lle

Ei huomautusta

Hyvin merkityt ja kultaisen standardin kliiniset tekstitiedot kliinisen NLP:n kouluttamiseksi/kehittämiseksi Healthcare API:n seuraavan version rakentamiseksi

Kliinisen luonnollisen kielen käsittelyn (NLP) merkitys on tunnustettu yhä enemmän viime vuosina, ja se on johtanut muuttaviin edistysaskeliin. Kliinisen NLP:n avulla tietokoneet voivat ymmärtää rikkaan merkityksen, joka piilee lääkärin kirjallisen potilasanalyysin takana. Kliinisellä NLP:llä voi olla useita käyttötapauksia väestön terveysanalytiikasta kliinisen dokumentaation parantamiseen puheentunnistukseen kliinisten kokeiden yhteensovittamiseen jne.

Kliinisten NLP-mallien kehittämiseen ja kouluttamiseen tarvitaan tarkkoja, puolueettomia ja hyvin merkittyjä tietojoukkoja valtavia määriä. Gold Standard ja monipuoliset tiedot auttavat parantamaan NLP-moottoreiden tarkkuutta ja muistamista.

tilavuus

Asiakirjojen lukumäärä huomautettuna
10
Sivujen lukumäärä huomautettuna
10 +
Projektin kesto
< 1 kk

Haasteet

Asiakas odotti innolla pääsevänsä kouluttamaan ja kehittämään Natural Language Processing (NLP) -alustaa uusilla entiteettityypeillä sekä tunnistamaan erilaisten tyyppien välisiä suhteita. Lisäksi he arvioivat myyjiä, jotka tarjosivat suurta tarkkuutta, noudattivat paikallisia lakeja ja joilla oli tarvittava lääketieteellinen tietämys suuren tietojoukon merkitsemiseen.

Tehtävänä oli merkitä ja merkitä jopa 20,000 15,000 merkittyä tietuetta, mukaan lukien jopa 5,000 1 merkittyä tietuetta sairaala- ja avohoidon sähköisistä terveystietueista (EHR) ja jopa 2 XNUMX merkittyä tietuetta litteroiduista lääketieteellisistä saneluista, jaettuna tasaisesti (XNUMX) maantieteelliseen alkuperään ja ( XNUMX) saatavilla olevat lääketieteen erikoisuudet.

Yhteenvetona haasteista:

  • Järjestä heterogeeniset kliiniset tiedot NLP-alustan kouluttamiseksi
  • Tunnista eri entiteettien välinen suhde kriittisen tiedon saamiseksi
  • Kyky ja asiantuntemus merkitä / merkitä laaja joukko monimutkaisia ​​kliinisiä asiakirjoja
  • Kustannusten pitäminen hallinnassa suuren tietomäärän merkitsemiseksi/merkintämiseksi kliinisen NLP:n kouluttamiseksi säädetyssä ajassa
  • Merkitse kliinisen tietojoukon entiteetit, joka koostuu 75 % EHR- ja 25 % sanelutietueista.
  • Tietojen tunnistamisen poistaminen toimitushetkellä

Muita luonnollisen kielen ymmärtämisen haasteita

epäselvyys

Sanat ovat ainutlaatuisia, mutta niillä voi olla erilaisia ​​merkityksiä kontekstista riippuen, mikä johtaa moniselitteisyyteen leksikaalisella, syntaktisella ja semanttisella tasolla.

synonymy

Voimme ilmaista samaa ajatusta eri termeillä, jotka ovat myös synonyymejä: iso ja suuri tarkoittavat samaa kohdetta kuvattaessa.

Coreference

Prosessia, jossa etsitään kaikki lausekkeet, jotka viittaavat samaan kokonaisuuteen tekstistä, kutsutaan ydinresoluutioksi.

Persoonallisuus, aikomus, tunteet

Riippuen puhujan persoonallisuudesta, hänen tarkoituksensa ja tunteensa voivat ilmaistua eri tavalla samalle ajatukselle.

Ratkaisu

Saatavilla on suuri määrä lääketieteellistä tietoa ja tietämystä lääketieteellisten asiakirjojen muodossa, mutta se on pääasiassa jäsentämättömässä muodossa. Medical entity Annotation / Named Entity Recognition (NER) -merkinnän avulla Shaip pystyi muuttamaan jäsentelemättömät tiedot strukturoituun muotoon merkitsemällä hyödyllistä tietoa erityyppisistä kliinisistä tietueista. Kun entiteetit oli tunnistettu, myös niiden välinen suhde kartoitettiin kriittisen tiedon tunnistamiseksi.

Työn laajuus: Terveydenhuollon yksikön maininta

9 Entiteettityypit

  • Sairaus
  • Lääketieteellinen toimenpide
  • Anatominen rakenne
  • Lääketiede
  • Lääketieteellinen laite
  • Kehon mittaus
  • Aineen väärinkäyttö
  • Laboratoriotiedot
  • Kehon toiminta

17 muuntajaa

  • Lääkityksen muuttajat: vahvuus, yksikkö, annos, alkaen, taajuus, reitti, kesto, tila
  • Body Measurement Modifiers: arvo, yksikkö, tulos
  • Menettelyn modifioijat: Menetelmä
    • Laboratoriotietojen muuntaja: Laboratorioarvo, Laboratorioyksikkö, Laboratoriotulos
  • Vakavuus
  • Menettelyn tulos

27 Suhteet ja potilaan tila

Tulos

Annotoituja tietoja käytettäisiin asiakkaan kliinisen NLP-alustan kehittämiseen ja kouluttamiseen, joka sisällytettäisiin heidän Healthcare API:n seuraavaan versioon. Asiakkaan hyötyjä olivat:

  • Merkitty/merkityt tiedot täyttivät Asiakkaan vakiotietomerkintöjä koskevat ohjeet.
  • Heterogeenisiä tietojoukkoja käytettiin NLP-alustan kouluttamiseen tarkkuuden lisäämiseksi.
  • Suhde eri entiteettien välillä, eli anatominen kehon rakenne <> lääkinnällinen laite, lääketieteellinen tila <> lääketieteellinen laite, lääketieteellinen tila <> lääkitys, lääketieteellinen tila <> menetelmä kriittisten lääketieteellisten tietojen saamiseksi.
  • Laaja tietojoukko, joka oli merkitty/merkitty, myös poistettiin toimituksen yhteydessä.

Yhteistyömme Shaipin kanssa edisti merkittävästi Ambient Technology- ja Conversational AI -projektiamme terveydenhuollossa. Heidän asiantuntemuksensa synteettisten terveydenhuoltokeskustelujen luomisessa ja transkriptiossa loi vankan perustan, joka esitteli synteettisen datan potentiaalia sääntelyn haasteiden voittamiseksi. Shaipin avulla navigoimme näillä esteillä ja olemme nyt askeleen lähempänä visiomme toteuttamista intuitiivisista terveydenhuoltoratkaisuista.

Kultainen - 5 tähden

Nopeuta keskusteluaiheisuutta
sovelluskehitys 100%