OpenAI công bố các mô hình và sản phẩm trí tuệ nhân tạo (AI) mới cho nhà phát triển tại DevDay.
Tác giảViettel Support

OpenAI chia sẻ hàng chục sự bổ sung và cải tiến mới, và giảm giá cho nhiều dịch vụ trên nền tảng trong ngày 6/11. Các điểm đáng chú ý bao gồm:

  • Mô hình GPT-4 Turbo mới,  mạnh mẽ hơn, giá rẻ hơn và hỗ trợ cửa sổ ngữ cảnh 128K tokens.
  • Trợ lý API (giao diện lập trình ứng dụng) mới, giúp cho nhà phát triển dễ dàng xây dựng ứng dụng trí tuệ nhân tạo hỗ trợ riêng của họ, có mục tiêu nhất định và có thể truy hồi các mô hình và công cụ.
  • Khả năng đa phương tiện mới trong nền tảng, bao gồm công nghệ đọc hình ảnh, tạo hình ảnh (DALL·E 3) và chuyển văn bản thành giọng nói (TTS).

OpenAI, một công ty nghiên cứu trí tuệ nhân tạo hàng đầu, đã tổ chức OpenAI Dev Day đầu tiên vào ngày 6 tháng 11 năm 2023 tại San Francisco. Sự kiện này đã trưng bày những tiến bộ mới nhất của công ty trong lĩnh vực nghiên cứu và phát triển trí tuệ nhân tạo, và nó đã có một số thông báo về các mô hình và sản phẩm dành cho nhà phát triển. Trong bài diễn thuyết chính, CEO của OpenAI, Sam Altman, nhấn mạnh nhiệm vụ của công ty là "đảm bảo rằng trí tuệ nhân tạo tổng quát mang lại lợi ích cho toàn nhân loại". Ông cũng nhấn mạnh tầm quan trọng của việc làm cho trí tuệ nhân tạo trở nên dễ tiếp cận đối với các nhà phát triển, để họ có thể xây dựng các ứng dụng mới và sáng tạo trên nền công nghệ của OpenAI.

 

Dưới đây là tổng hợp tóm tắt các nội dung chính được công bố tại OpenAI DevDay:

GPT-4 Turbo với hỗ trợ cửa sổ ngữ cảnh 128K tokens.

GPT-4 Turbo có được cập nhật thông tin về các sự kiện thế giới cho đến tháng 4 năm 2023. Nó có cửa sổ ngữ cảnh 128k, cho phép chứa tương đương hơn 300 trang văn bản trong một đoạn gửi duy nhất. OpenAI cũng đã tối ưu hóa hiệu suất của nó, do đó chi phí vận hành GPT-4 Turbo rẻ hơn gấp 3 lần cho các token đầu vào và hơn gấp 2 lần cho các token đầu ra so với mẫu GPT-4 trước đó.

GPT-4 Turbo đã sẵn sàng cho tất cả các nhà phát triển trả phí thử nghiệm bằng cách nhập code gpt-4-1106-preview trong API, và được dự định sẽ phát hành phiên bản ổn định và sẵn sàng cho sử dụng trong những tuần sắp tới.

gpt-4

Assistant API (trợ lý API), Retrieval (thu hồi thông tin) và Code Interpreter (giải thích code).

Assistant API là một trí tuệ nhân tạo được xây dựng với mục đích cụ thể, sử dụng kiến thức bổ sung và có thể truy hồi các mô hình và công cụ để thực hiện các nhiệm vụ. Assistant API mới cung cấp các khả năng mới như Code Interpreter và Retrieval cũng như gọi hàm để xử lý nhiều công việc nặng mà trước đây phải tự làm và cho phép bạn xây dựng các ứng dụng trí tuệ nhân tạo chất lượng cao.

API này được thiết kế linh hoạt các nhiệm vụ, có thể được sử dụng như một ứng dụng phân tích dữ liệu dựa trên ngôn ngữ tự nhiên, một trợ lý lập trình, một trình lập kế hoạch kỳ nghỉ được hỗ trợ bởi trí tuệ nhân tạo, một trình phát nhạc điều khiển bằng giọng nói, một bảng hiển thị hình ảnh thông minh - và còn nhiều hơn thế nữa.

Assistant API cũng có quyền truy cập để gọi các công cụ mới khi cần thiết, bao gồm:

Code Interpreter: viết và chạy mã Python trong một môi trường thực thi cô lập, và có thể tạo ra đồ thị và biểu đồ, xử lý các tệp tin chứa dữ liệu và định dạng đa dạng. Nó cho phép trợ lý của bạn chạy mã lặp đi lặp lại để giải quyết các vấn đề mã và toán học khó khăn, và nhiều hơn nữa.

Retrieval: bổ sung trợ lý với kiến thức từ bên ngoài các mô hình của OpenAI, như dữ liệu lĩnh vực độc quyền, thông tin sản phẩm hoặc tài liệu được người dùng cung cấp. Điều này có nghĩa là bạn không cần tính toán và lưu trữ các embedding cho tài liệu của bạn, hoặc triển khai các thuật toán chia nhỏ và tìm kiếm.

Gọi hàm: cho phép trợ lý gọi các hàm bạn định nghĩa và tích hợp phản hồi của hàm vào các tin nhắn.

GPT-4 Turbo với Vision


GPT-4 Turbo với Vision là một phiên bản của GPT-4 Turbo có thể tạo ra văn bản và hình ảnh. Điều này có nghĩa là nhà phát triển hiện có thể sử dụng GPT-4 Turbo để tạo ra các ứng dụng trí tuệ nhân tạo có khả năng tạo ra cả nội dung văn bản và hình ảnh.

Được giới thiệu tại OpenAI Dev Day, điều này có thể dẫn đến một thế hệ mới của các công cụ sáng tạo được trang bị trí tuệ nhân tạo, chẳng hạn như phần mềm chỉnh sửa hình ảnh và phần mềm chỉnh sửa video giúp người dùng tạo ra nội dung chất lượng cao một cách nhanh chóng và dễ dàng.

DALL-E 3 API


DALL-E 3 API là một API công khai cho DALL-E 3, mô hình tạo ra hình ảnh của OpenAI. DALL-E 3 là một trong những mô hình tạo ra hình ảnh mạnh mẽ nhất trên thế giới và có thể tạo ra những hình ảnh thực tế từ mô tả văn bản.

DALL-E 3 API sẽ cho phép nhà phát triển tích hợp DALL-E 3 vào các ứng dụng và dịch vụ của riêng họ. Điều này có thể dẫn đến một thế hệ mới của các công cụ chỉnh sửa hình ảnh, công cụ chỉnh sửa video và các ứng dụng sáng tạo khác được trang bị trí tuệ nhân tạo.

Comprehensive Guide to DALL-E By OpenAI: Creating Images from Text

GPTs


OpenAI đang ra mắt tính năng mới mang tên GPTs, cho phép bất kỳ ai cũng có thể tạo ra các phiên bản tùy chỉnh của ChatGPT cho mục đích cụ thể. GPTs rất dễ tạo, ngay cả đối với những người không có kinh nghiệm lập trình.

Để tạo một GPT, bạn chỉ cần bắt đầu một cuộc trò chuyện với ChatGPT và đưa cho nó các hướng dẫn và kiến thức bổ sung. Bạn cũng có thể chọn những gì GPT có thể làm, chẳng hạn như tìm kiếm trên web, tạo hình ảnh hoặc phân tích dữ liệu. Sau khi bạn đã tạo một GPT, bạn có thể chia sẻ nó với người khác hoặc sử dụng một mình. Hiện nay, cũng có một số GPT mẫu có sẵn cho người dùng ChatGPT Plus và Enterprise thử nghiệm.

Nguồn: OpenAI

Liên hệ ngay tới số 0386.106.999 để được tư vấn miễn phí lắp đặt Wi-Fi với mangviettel.net.vn.

0 / 5 (0Bình chọn)
Bình luận
Gửi bình luận
Bình luận