#
regex
Für Automatisierung oder anything else
- Dokument wurde per OCR zerlegt, Textinhalt liegt nun vor
- Metadaten identifizieren extrahieren
bspw. Datum
copy
(?<!\d)(\d|0\d|1\d|2\d|3\d)[\.,]\s{0,3}(\d|0\d|1[012]|Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember)[\.,]?\s{0,3}(19\d{2}|20\d{2}|\d{2}(?!\d))