From: Text normalization for named entity recognition in Vietnamese tweets
Original tweet | xe đón h\(\grave{\hat{{\mathrm{o}}}}\quad\) ngọc hà gây tai nạn kinhh hoàng: sẽ khởi tố tài xế http://fb.me/2MwvznBbj |
Step 1: Normalization | xe đón h\(\grave{\hat{{\mathrm{o}}}}\) ngọc hà gây tai nạn kinh hoàng: sẽ khởi tố tài xế |
Step 2: Capitalization | Xe đón H \(\grave{\hat{{\mathrm{o}}}}\) Ngọc Hà gây tai nạn kinh hoàng: sẽ khởi tố tài xế |
Step 3: NEs recognition | Xe đón <PER> H\(\grave{\hat{{\mathrm{o}}}}\) Ngọc Hà </PER> gây tai nạn kinh hoàng: sẽ khởi tố tài xế |