corpora

/'kɔ:pəs/
Học thuật
Thân thiện
corpora

A researcher analyzes several corpora of historical texts on a large computer screen.

Định nghĩa
  1. Danh từ (số nhiều của 'corpus'):
    • Tập hợp văn bản, ngữ liệu: Một bộ sưu tập lớn cấu trúc các văn bản viết hoặc lời nói, được thu thập để phân tích ngôn ngữ học hoặc nghiên cứu học thuật.
    • Tập sao lục, tập văn: Một bộ sưu tập các tài liệu hoặc văn bản về một chủ đề cụ thể.
dụ sử dụng
  • Danh từ:
    • Linguists use large corpora to study how language changes over time. (Các nhà ngôn ngữ học sử dụng những tập ngữ liệu lớn để nghiên cứu ngôn ngữ thay đổi theo thời gian như thế nào.)
    • The research is based on an analysis of several digital corpora of news articles. (Nghiên cứu dựa trên việc phân tích nhiều tập hợp văn bản số hóa các bài báo tin tức.)
Các cách sử dụng nâng cao
  • "Parallel corpora": Tập ngữ liệu song song (chứa các văn bản cùng nội dung được dịch sang hai hay nhiều ngôn ngữ).

    • Machine translation systems are often trained on parallel corpora. (Các hệ thống dịch máy thường được huấn luyện trên các tập ngữ liệu song song.)
  • "Monitor corpora": Tập ngữ liệu theo dõi (được cập nhật liên tục để theo dõi sự phát triển của ngôn ngữ).

    • The monitor corpus allows us to track the emergence of new words. (Tập ngữ liệu theo dõi cho phép chúng tôi theo dõi sự xuất hiện của các từ mới.)
Biến thể từ gần giống
  • Corpus (số ít) (n): Tập hợp văn bản, ngữ liệu; thân thể, khối chính.

    • The entire corpus of Shakespeare's works is available online. (Toàn bộ tập hợp tác phẩm của Shakespeare sẵn trực tuyến.)
  • Corpuscle (n): (Sinh vật học) Huyết cầu, tiểu thể.

    • Red blood corpuscles carry oxygen. (Các huyết cầu đỏ mang oxy.)
Từ đồng nghĩa
  • Collections: Các bộ sưu tập.
  • Compilations: Các tuyển tập, bản biên soạn.
  • Databases: Các cơ sở dữ liệu (trong ngữ cảnh kỹ thuật số).
Lưu ý
  • Corpora dạng số nhiều của danh từ Latin corpus. Trong tiếng Anh, dạng số nhiều thông thường corpuses cũng được chấp nhận, nhưng corpora thường được ưu tiên sử dụng trong các ngữ cảnh học thuật ngôn ngữ học.
  • Trong giải phẫu học sinh vật học, corpus (số ít) có thể chỉ các phần của cơ thể ( dụ: - thể chai, - thể vân). Dạng số nhiều corpora cũng được dùng trong các ngữ cảnh này.
corpora

A researcher analyzes several corpora of historical texts on a large computer screen.

danh từ, số nhiều corpora
  1. tập sao lục, tập văn
  2. (sinh vật học) thể
    • corpus striatum
      thể vân