“Giải mã” hiện tượng Chat GPT

Thời gian gần đây, thông tin về Chat GPT đem đến nhiều suy nghĩ, cảm xúc trái chiều của người dùng. Vậy, Chat GPT là gì, nó có thực sự hữu ích hay gây nguy hiểm đối với con người?

Chat GPT là một trợ lý ảo được xây dựng trên nền tảng trí tuệ nhân tạo (AI) và học sâu (deep learning) của OpenAI. Ảnh minh họa

Chat GPT là một trợ lý ảo được phát hành vào tháng 11-2022, xây dựng trên nền tảng trí tuệ nhân tạo (AI) và học sâu (deep learning) của OpenAI. Sản phẩm trí tuệ nhân tạo gần “giống người” nhất hiện nay, có khả năng trả lời các câu hỏi, cung cấp thông tin và hỗ trợ các nhu cầu khác của người dùng thông qua việc xử lý ngôn ngữ tự nhiên.

Chat GPT là gì?

Chat GPT là một mô hình xử lý ngôn ngữ tự nhiên thế hệ mới dựa trên kiến trúc học sâu “biến áp” (transformer) và lượng dữ liệu lớn khổng lồ, được đào tạo trên siêu máy tính AI của Azure. Mô hình này có khả năng xử lý một lượng lớn văn bản và học cách thực hiện các tác vụ xử lý ngôn ngữ tự nhiên rất hiệu quả. Đặc biệt, mô hình GPT-3 có kích thước 175 tỷ tham số, khiến nó trở thành mô hình ngôn ngữ lớn nhất từng được đào tạo. Để làm việc, GPT cần được “đào tạo” trên một lượng lớn văn bản. Ví dụ, mô hình GPT-3 đã được đào tạo trên một cơ sở dữ liệu bao gồm hơn 8 triệu tài liệu và hơn 10 tỷ từ. Từ cơ sở dữ liệu này, mô hình học cách thực hiện các nhiệm vụ xử lý ngôn ngữ tự nhiên và tạo ra văn bản mạch lạc, được viết tốt. Một khi mô hình được đào tạo tốt, GPT có thể được sử dụng để thực hiện một loạt nhiệm vụ, như: để tạo ra các câu trả lời phù hợp và nhất quán cho một trợ lý ảo trong nhiều ngữ cảnh; để tạo ra các bài đăng và tin nhắn hấp dẫn cho các mạng xã hội; có thể tạo báo cáo, e-mail và nội dung khác cho các ứng dụng năng suất; có thể được phân tích và thông tin có giá trị có thể được trích xuất từ chúng...

OpenAI là một công ty nghiên cứu trí tuệ nhân tạo được thành lập vào năm 2015 bởi một số tên tuổi lớn trong ngành công nghệ, như Elon Musk, Sam Altman và Greg Brockman, cùng với một số nhà nghiên cứu hàng đầu về trí tuệ nhân tạo. Mục tiêu của công ty là nghiên cứu và phát triển AI thông minh, an toàn và hữu ích cho con người. Công ty tập trung vào các lĩnh vực, như học sâu, robotica, tiếng nói, tự động hóa...

Làm sao Chat GPT có thể trả lời câu hỏi?

Chat GPT có thể trả lời câu hỏi dựa trên phương pháp học máy (machine learning), đặc biệt là mô hình học sâu. Chat GPT được huấn luyện trên một lượng lớn dữ liệu văn bản và sử dụng mô hình biến áp để hiểu và xử lý thông tin trong các câu hỏi. Mô hình biến áp là một mô hình học sâu đặc biệt được sử dụng cho các tác vụ xử lý ngôn ngữ tự nhiên và có khả năng giải quyết vấn đề về phụ thuộc xa (long-range dependency) trong các chuỗi văn bản.

Cụ thể, Chat GPT sử dụng kiến trúc mạng nơ ron tự động dịch (auto-regressive neural network) để dự đoán từ tiếp theo trong câu trả lời dựa trên các từ trước đó. Điều này có nghĩa là Chat GPT có khả năng “nhớ” và sử dụng thông tin từ cả câu hỏi và các văn bản đã huấn luyện để tạo ra các câu trả lời phù hợp. Khi nhận được câu hỏi mới, Chat GPT sẽ xác định các từ và cụm từ quan trọng trong câu hỏi, tìm kiếm các câu tương tự trong tập dữ liệu huấn luyện và tạo ra câu trả lời dựa trên những thông tin đó. Chẳng hạn, nếu bạn hỏi Chat GPT “ai là người đầu tiên bước chân lên Mặt trăng?”, Chat GPT sẽ sử dụng mô hình học sâu để hiểu và phân tích câu hỏi này. Trước tiên, Chat GPT sẽ xác định các từ và cụm từ quan trọng trong câu hỏi, chẳng hạn như “người đầu tiên”, “bước chân lên”, “Mặt trăng”. Sau đó, Chat GPT sẽ tìm kiếm trong tập dữ liệu huấn luyện các câu liên quan đến chủ đề này và sử dụng thông tin đó để tạo ra câu trả lời phù hợp. Trong trường hợp này, Chat GPT có thể sử dụng thông tin về chuyến bay lên Mặt trăng vào năm 1969 của các nhà du hành vũ trụ Neil Armstrong và Buzz Aldrin để đưa ra câu trả lời chính xác: “Neil Armstrong là người đầu tiên bước chân lên Mặt trăng”.

Chat GPT được phát triển trên ngôn ngữ và phương pháp nào?

Chat GPT được phát triển trên ngôn ngữ lập trình Python và sử dụng một số thư viện chính của Python để xử lý và phân tích dữ liệu, đặc biệt là thư viện TensorFlow để triển khai mô hình học sâu. Ngoài ra, Chat GPT cũng sử dụng nhiều công nghệ và công cụ khác nhau để bảo đảm tính chính xác và độ tin cậy của thông tin được cung cấp cho người dùng.

Theo OpenAI, họ đã sử dụng nhiều phương pháp và mô hình để phát triển Chat GPT-3, bao gồm: xử lý ngôn ngữ tự nhiên sâu (DNLP) là một phương pháp; sử dụng các mô hình mạng nơ-ron sâu để xử lý ngôn ngữ tự nhiên. Trong đó, các mô hình học sâu được sử dụng để giải quyết các vấn đề trong xử lý ngôn ngữ tự nhiên như ngữ pháp, cú pháp, ngữ nghĩa, tương đồng nội dung, dịch máy, tự động tóm tắt văn bản, phân tích cảm xúc, và nhiều ứng dụng khác. Chat GPT sử dụng các phương pháp DNLP để xử lý và trả lời các câu hỏi của người dùng. Nó sử dụng mô hình mạng nơ-ron sâu để học từ dữ liệu và xác định các mối quan hệ và sự tương đồng giữa các từ và câu. Sau đó, Chat GPT sử dụng mô hình này để tạo ra các phản hồi tự động và đưa ra các đề xuất và giải pháp cho người dùng.

Học chuyển giao (transfer learning): đây là một phương pháp học máy mà một mô hình học từ một tập dữ liệu và sau đó chuyển học được đến các tác vụ khác. OpenAI đã sử dụng học chuyển giao để phát triển Chat GPT-3 bằng cách huấn luyện mô hình trên các tập dữ liệu lớn và sau đó sử dụng kết quả này để tạo ra một mô hình ngôn ngữ tự nhiên tốt hơn.

Xử lý ngôn ngữ tự nhiên (NLP): đây là một lĩnh vực trong học máy tập trung vào việc phân tích, xử lý và tạo ra ngôn ngữ tự nhiên, chẳng hạn như văn bản, giọng nói và ngôn ngữ của con người. Chat GPT-3 là một mô hình NLP được xây dựng trên các phương pháp và mô hình học máy này.

Phản hồi (Human feedback): dựa trên dữ liệu đã học từ người dùng để tạo ra một câu trả lời có thể không chính xác hoặc không đầy đủ. Vì vậy, để cải thiện chất lượng của câu trả lời, Chat GPT có thể yêu cầu người dùng cung cấp thêm thông tin bằng cách yêu cầu phản hồi từ con người. Người dùng có thể đánh giá câu trả lời của Chat GPT là chính xác hay không, cũng như đưa ra sự phản hồi để cải thiện câu trả lời.

Tuy nhiên, cụ thể phương pháp nào được sử dụng trong Chat GPT phụ thuộc vào mục đích cụ thể của ứng dụng và các bước tiền xử lý dữ liệu. Microsoft độc quyền về mô hình Chat GPT-3. Phiên bản đầu tiên của Chat GPT - GPT-1 - chỉ được ra mắt vào cuối năm 2018. Sau đó, OpenAI đã tiếp tục phát triển các phiên bản mới của Chat GPT, bao gồm GPT-2 và GPT-3, với số lượng tham số tăng dần lên đáng kể và khả năng xử lý ngôn ngữ tự nhiên ngày càng tốt hơn. Chat GPT-3 có thể nói “gần giống người” nhất. Tháng 9-2020, Microsoft đánh giá “Chat GPT-3 là một mô hình ngôn ngữ tự động tạo ra văn bản giống con người nhất, mô hình ngôn ngữ lớn nhất và tiên tiến nhất trên thế giới” và hợp tác với OpenAI để cấp phép độc quyền mô hình ngôn ngữ GPT-3 và tận dụng các cải tiến kỹ thuật của Microsoft, phát triển và cung cấp các giải pháp AI tiên tiến cho khách hàng của họ, cũng như tạo ra các giải pháp mới khai thác sức mạnh đáng kinh ngạc của việc tạo ngôn ngữ tự nhiên tiên tiến. Sản phẩm thương mại hóa gọi là Chat GPT Plus và Chat GPT mở hiện có những hạn chế về số liệu và mô hình. Việc Microsoft độc quyền về mô hình Chat GPT-3 gây ra tranh cãi về bản quyền các dữ liệu mở như Wikipedia và Common Crawl,... và hầu hết các trang Internet vì các câu trả lời của Chat GPT không dẫn nguồn tham chiếu từ đâu.

Chat GPT có nguy hiểm cho con người không?

Chat GPT và các công nghệ liên quan đến AI
có thể mang lại nhiều lợi ích cho con người
nếu được sử dụng đúng cách. Ảnh: Reuters

Hiện tại, Chat GPT không gây nguy hiểm trực tiếp cho con người. Tuy nhiên, việc sử dụng AI và các công nghệ liên quan đến Chat GPT có thể gây ra những vấn đề đạo đức và pháp lý. Nếu được sử dụng đúng cách, Chat GPT và các công nghệ liên quan đến AI có thể mang lại nhiều lợi ích cho con người, từ việc giải quyết các vấn đề khó khăn đến cải thiện chất lượng cuộc sống. Tuy nhiên, nếu không được sử dụng đúng cách, Chat GPT có thể dẫn đến các vấn đề như xâm phạm quyền riêng tư, phân biệt chủng tộc, bạo lực, hoặc thậm chí có thể gây ra tai hại cho con người như: tạo đầu ra thiên vị hoặc độc hại: một mô hình ngôn ngữ được đào tạo về dữ liệu thiên vị hay độc hại có thể tái tạo mô hình đó trong đầu ra của nó, ngay cả khi nó không được hướng dẫn rõ ràng để làm như vậy. Làm sai: không làm theo hướng dẫn rõ ràng của người dùng. Ảo giác: mô hình tạo nên những sự thật không tồn tại hoặc sai lầm. Thiếu khả năng diễn giải: rất khó để con người hiểu làm thế nào mô hình đi đến một quyết định hoặc dự đoán cụ thể. Việc bảo đảm an toàn và đạo đức trong việc phát triển và sử dụng AI là rất quan trọng để bảo đảm lợi ích cho con người.

Gần đây, chính quyền Trung Quốc đã cấm sử dụng Chat GPT và dùng bức tường lửa “Vạn lý trường thành” để chặn người truy cập với lý do “Mỹ sử dụng AI để truyền bá thông tin sai lệch”. Điều này tương đối dễ hiểu vì Trung Quốc đã cấm người dùng truy cập Google, Facebook,... hay các trang web bị cho là “độc hại” và gây thiệt thòi cho người dùng “bình thường” nhưng những người có chút trình độ công nghệ thông tin vẫn truy cập được dễ dàng. Tuy vậy, Chat GPT là nguồn cảm hứng cho các công ty khác phát triển sản phẩm tương tự như Google Bard hay Baidu ERNIE (Trung Quốc). Hy vọng, chúng ta sẽ có những sản phẩm “giống người” hơn trong tương lai gần.

Việt Nam nên làm gì?

Việt Nam nên bắt đầu xây dựng những API - giao diện cho các ứng dụng với các giao thức chuẩn đến các thư viện từ điển tiếng Việt số, từ điển đồng nghĩa tiếng Việt số, từ điển Việt - Anh/Anh - Việt,... vì nó là nền tảng để giúp phát triển tốt hơn trợ lý ảo, các ứng dụng xử lý ngôn ngữ tự nhiên bằng tiếng Việt trong tương lai. Bên cạnh đó, cần có luật quy định ứng xử và sử dụng đúng cách các sản phẩm AI để tránh những lạm dụng như đã bàn ở trên.

Những ứng dụng của các sản phẩm AI là vô cùng rộng lớn nhưng không hoạt động tốt nếu không có dữ liệu lớn, mô hình xử lý dữ liệu tốt và siêu máy tính. Trong đó dữ liệu là mỏ “dầu” từ sản phẩm đầu ra của những ứng dụng hay thiết bị Internet vạn vật (IoT) mà các chuyên gia công nghệ thông tin phát triển. Nhà nước nên chú trọng hơn nữa việc đào tạo công nghệ thông tin và tạo môi trường làm việc cho tài năng thực sự giỏi. Lấy việc đẩy mạnh chuyển đổi số và phát triển sản phẩm công nghệ thông tin như một trong những chiến lược quan trọng nhất để phát triển đất nước./.

Lâm Việt Tùng- Chuyên gia Công nghệ Thông tin (Hà Lan)

Nguồn: Hồ Sơ Sự Kiện, số 490 , ngày 10-3-2023

“Giải mã” hiện tượng Chat GPT

Tin liên quan

Tin tiêu điểm