Thư động lực
Kính gửi Hội đồng Tuyển sinh của École Polytechnique,
Truyền thống của Polytechnique — niềm tin rằng những thách thức lớn nhất của con người đòi hỏi sự đào tạo khoa học nghiêm ngặt nhất — là điều em biết đến không phải qua brochure mà qua quá trình tự đọc và tìm hiểu. Danh sách cựu sinh viên của trường giống như một bản đồ của hiện đại: các kỹ sư, nhà toán học, nhà vật lý đã góp phần định hình thế giới. Em không dám mặc nhiên cho rằng mình sẽ đi theo những dấu chân ấy; em chỉ dám nói rằng mình chia sẻ khát vọng đó.
Theo hiểu biết của em, Bachelor of Science tại l'X là một trong rất ít chương trình đại học coi sự rộng của nền tảng khoa học không phải là sự thỏa hiệp, mà là một triết lý: một nhà nghiên cứu trong bất kỳ lĩnh vực nào cũng sẽ tốt hơn nếu đã học sâu từ nhiều lĩnh vực. Em hoàn toàn đồng cảm với triết lý đó.
Hành trình học tập của em cũng được hình thành theo tinh thần như vậy. Ở Việt Nam, em theo đuổi đồng thời toán, tin học, vật lý và văn học không phải vì chương trình bắt buộc, mà vì em tin mỗi lĩnh vực làm sắc hơn các lĩnh vực còn lại. Em từng đứng đầu toàn quốc trong nhóm của mình, giành huy chương vàng Olympic Toán và xây dựng một dự án nghiên cứu về medical AI tiếng Việt trong khoảng trống giữa các cam kết học thuật đó.
Em đang học tiếng Pháp một cách nghiêm túc và thực sự có hứng thú. Văn hóa trí thức của Paris — seminar, tranh luận và thái độ không xem ý tưởng nào là không đáng kiểm tra — là điều em đã ngưỡng mộ từ xa trong thời gian dài. Em mong được trải nghiệm trực tiếp và đóng góp vào môi trường đó bằng những gì mình có thể.
Je vous adresse mes respectueuses salutations,
Curriculum Vitae
Bảng điểm học tập
Certified transcript available upon request.
| Môn học | Năm | Điểm | Xếp loại | Ghi chú |
|---|---|---|---|---|
| Advanced Mathematics | 2022–2025 | 9.8 / 10 | A+ | Top of cohort |
| Informatics / Computer Science | 2022–2025 | 9.9 / 10 | A+ | Top of cohort |
| Physics | 2022–2025 | 9.5 / 10 | A | |
| English Language | 2022–2025 | 9.7 / 10 | A+ | IELTS 8.0 |
| Chemistry | 2022–2025 | 9.2 / 10 | A | |
| Literature & Humanities | 2022–2025 | 9.0 / 10 | A | |
| Cumulative Average | 9.6 / 10 | A+ | GPA 3.98 / 4.0 |
Thư giới thiệu
Đề xuất hướng nghiên cứu
Motivation. Phần lớn nghiên cứu clinical AI hiện nay được tiến hành trên các ngôn ngữ giàu tài nguyên như English, Mandarin hay German, với các bộ dữ liệu loại trừ một cách cấu trúc những cộng đồng tại Đông Nam Á. Tiếng Việt với hơn 95 triệu người nói hiện vẫn có chưa tới một tá corpus mở dành cho medical NLP.
Proposed Research Direction. Em muốn khảo sát các phương pháp transfer learning, cụ thể là các multilingual pre-trained transformers như mBERT và XLM-R, cho bài toán nhận diện thực thể y khoa và phân loại triệu chứng bằng tiếng Việt, đồng thời xem cần bao nhiêu dữ liệu gán nhãn và các thiên lệch nhân khẩu học lan truyền qua biên giới ngôn ngữ như thế nào.
Preliminary Work. Một bộ phân loại triệu chứng sốt xuất huyết huấn luyện trên 1,200 patient summaries tiếng Việt được gán nhãn thủ công đạt F1 87.3% — đáng khích lệ so với độ đơn giản của phương pháp, nhưng rõ ràng chưa đủ nếu muốn đi tới quy mô thực tế. Dự án này cho em thấy đồng thời cả tiềm năng lẫn giới hạn lớn khi làm việc mà không có data infrastructure phù hợp.
Fit with École Polytechnique. Em đặc biệt muốn tiếp cận nền tảng toán học của machine learning — generalization theory, PAC learning và hệ quả của chúng đối với độ tin cậy của mô hình trong các ứng dụng medical AI có rủi ro cao.