DALL-E 3 – Trình tạo hình ảnh mới nhất của OpenAI
Allfreevn 2 tháng trước

DALL-E 3 – Trình tạo hình ảnh mới nhất của OpenAI

DALL-E 3 là gì, trình tạo hình ảnh mới nhất của OpenAI, cách sử dụng DALL-E 3, #allfreevn chia sẻ mọi điều về DALL-E 3 có thể thêm văn bản (không vô nghĩa) vào hình ảnh.

Dall-E 3 là gì?

Dall-E 3, công cụ nghệ thuật AI mới nhất của OpenAI. Nó sử dụng chatbot nổi tiếng của OpenAI, ChatGPT, để giúp tạo ra các tác phẩm nghệ thuật phức tạp và được sáng tác cẩn thận hơn bằng cách tự động mở rộng theo lời nhắc theo cách cung cấp cho trình tạo hướng dẫn chi tiết và mạch lạc hơn.

Điểm mới của Dall-E 3 là cách nó loại bỏ một số sự phức tạp cần có khi tinh chỉnh văn bản được cung cấp cho chương trình—cái được gọi là “kỹ thuật nhắc nhở”—và cách nó cho phép người dùng thực hiện các tinh chỉnh thông qua giao diện hội thoại của ChatGPT. Công cụ mới này có thể giúp hạ thấp tiêu chuẩn tạo ra các tác phẩm nghệ thuật AI phức tạp và có thể giúp OpenAI dẫn đầu đối thủ nhờ khả năng vượt trội của chatbot.

Như một trang thông tin mới về DALL-E 3 trên trang web OpenAI lưu ý: “Các hệ thống chuyển văn bản thành hình ảnh hiện đại có xu hướng bỏ qua các từ hoặc mô tả, buộc người dùng phải học kỹ thuật nhanh chóng. DALL-E 3 thể hiện một bước tiến trong công nghệ của chúng tôi”. khả năng tạo hình ảnh tuân thủ chính xác văn bản bạn cung cấp.”

Open AI cho biết họ sẽ tích hợp trực tiếp DALL-E 3 vào ChatGPT và ngụ ý mạnh mẽ rằng chatbot sẽ chuyển từ mô hình này sang mô hình khác, tùy thuộc vào nội dung của lời nhắc. ChatGPT, trước đây hoàn toàn là một đầu nối văn bản thân thiện với người dùng từ mô hình GPT-3.5, đang phát triển nhanh chóng — kết hợp các plugin của bên thứ ba với khả năng lấy văn bản từ các nguồn khác, bao gồm cả web. Động thái này tiếp tục đa dạng hóa khả năng của ChatGPT, mở rộng định nghĩa vốn đã căng thẳng về thuật ngữ “chatbot”.

Theo Altman, DALL-E 3 “sẽ được phổ biến tới tất cả người dùng ChatGPT+ trong vài tuần tới”. Trang web OpenAI cho biết tất cả khách hàng ChatGPT Plus và ChatGPT Enterprise sẽ có thể sử dụng nó “vào đầu tháng 10” và OpenAI sẽ không đưa ra bất kỳ khiếu nại bản quyền nào đối với kết quả đầu ra của mô hình.

Loại tác phẩm nghệ thuật kỳ quặc do AI tạo ra này đã trở nên phổ biến trên mạng xã hội nhờ một số công cụ biến lời nhắc văn bản thành bố cục trực quan

Loại tác phẩm nghệ thuật kỳ quặc do AI tạo ra này đã trở nên phổ biến trên mạng xã hội nhờ một số công cụ biến lời nhắc văn bản thành bố cục trực quan. Nhưng cái này được tạo ra với sự hỗ trợ nghệ thuật đáng kể từ ChatGPT, chỉ mất một đoạn nhắc ngắn và biến nó thành một cái chi tiết hơn, bao gồm cả hướng dẫn về cách soạn nó một cách chính xác.

Đó là một bước tiến lớn không chỉ đối với Dall-E mà còn đối với nghệ thuật AI nói chung. Dall-E, một từ ghép của nhân vật Pixar Wall-E và nghệ sĩ Salvador Dalí được công bố vào năm 2021 và ra mắt vào năm 2022, bao gồm một thuật toán cung cấp số lượng lớn hình ảnh được gắn nhãn được lấy từ web và các nguồn khác. Nó sử dụng cái được gọi là mô hình khuếch tán để dự đoán cách hiển thị hình ảnh cho một lời nhắc nhất định. Với số lượng dữ liệu đủ lớn, điều này có thể tạo ra hình ảnh phức tạp, mạch lạc và có tính thẩm mỹ. Điều khác biệt của Dall-E 3 nằm ở cách con người và máy móc tương tác với nhau.

Hình ảnh này do Dall-E 3 hiển thị cho thấy cách sử dụng ChatGPT để điền vào lời nhắc sẽ tạo ra hình ảnh mạch lạc và tinh vi hơn như thế nào. Thông thường, nó có thể yêu cầu một lượng lớn kỹ thuật nhanh chóng, theo đó người dùng thử các lời nhắc ngày càng phức tạp để tạo ra thứ gì đó phức tạp. Nhưng với Dall-E 3, ChatGPT đảm nhận công việc tạo ra lời nhắc phức tạp hơn.

Dall-E 3 tạo ra hình ảnh này để đáp lại lời nhắc sau: “Hình minh họa trái tim con người làm bằng thủy tinh mờ, đứng trên bệ giữa biển giông bão. Những tia nắng xuyên qua mây, chiếu sáng trái tim, lộ ra một vũ trụ nhỏ bé bên trong. Câu trích dẫn ‘Tìm vũ trụ bên trong bạn’ được khắc bằng chữ in đậm dọc theo đường chân trời.”

Dall-E 3 cũng sẽ cho phép người dùng tinh chỉnh tác phẩm thông qua ChatGPT, như thể họ đang yêu cầu một nghệ sĩ thực sự thực hiện các thay đổi. Aditya Ramesh, nhà nghiên cứu chính và người đứng đầu nhóm Dall-E cho biết: “Bạn sẽ không thực sự phải lo lắng về việc loay hoay với những lời nhắc quá dài”. “Thay vào đó, bạn chỉ có thể tương tác với ChatGPT như thể bạn đang nói chuyện với đồng nghiệp.”

Gabriel Goh, nhà nghiên cứu chính của nhóm Dall-E, đã trình diễn thủ thuật này cho WIRED bằng cách yêu cầu Dall-E 3 tạo một số áp phích quảng cáo cho một nhà hàng mì tưởng tượng. Sau khi được đưa ra một vài lựa chọn, Goh đã yêu cầu Dall-E 3, thông qua ChatGPT, lấy một trong số chúng và biến nó thành hình minh họa tấm biển treo bên ngoài một nhà hàng.

Dall-E 3 hiện có sẵn thông qua ChatGPT Plus, phiên bản trả phí của chatbot, #allfreevn chia sẻ.

DALL-E 3 có thân thiện hơn với người sáng tạo không?

Kể từ khi DALL-E ra mắt lần đầu vào năm 2019, quá trình đào tạo và khả năng vi phạm bản quyền của nó đã là nguồn gốc của nhiều tranh cãi.

Tương tự như ChatGPT, DALL-E 2 đã được đào tạo trên hàng triệu hình ảnh được lấy từ trang web mà không nhất thiết phải có sự đồng ý của chủ sở hữu chúng. Mặc dù điều này mở ra nguồn tài liệu phong phú nhưng nó cũng gây ra một cuộc tranh luận về quyền sở hữu hình ảnh do AI tạo ra, cũng như một số vụ kiện do các nghệ sĩ và người sáng tạo hình ảnh bất mãn đưa ra.

Để tránh những tình huống khó khăn về mặt đạo đức này, OpenAI đang thực hiện mọi thứ hơi khác một chút với DALL-E 3. Trình tạo văn bản thành hình ảnh sẽ từ chối các yêu cầu yêu cầu họ cung cấp hình ảnh được tạo theo phong cách của các nghệ sĩ sống. Công cụ này cũng cho phép người sáng tạo chọn không tham gia đào tạo mô hình tạo hình ảnh trong tương lai của họ.

Những nỗ lực của OpenAI rõ ràng đánh dấu một bước đi đúng hướng, đặc biệt đối với những người sáng tạo muốn loại bỏ vĩnh viễn tác phẩm nghệ thuật của họ khỏi bộ đào tạo của DALL-E. Tuy nhiên, đối với những người tin rằng tác phẩm nghệ thuật của họ đã bị đánh cắp thông qua các hoạt động lấy trộm xâm lấn của OpenAI, những sửa đổi này không làm giảm bớt mối lo ngại của họ, #allfreevn chia sẻ.

65 lượt xem | 0 Bình luận
Allfreevn là trang web yêu thích phim, game, công nghệ và kiến thức nên Allfreevn chia sẻ review phim, review game, thủ thuật máy tính, công nghệ, game… Allfreevn là tác giả chia sẻ kiến thức trend là gì, là ai nhanh nhất. Tác giả allfreevn thường viết các bài viết chia sẻ thông tin hot trend mạng xã hội, giải thích kiến thức là gì, là ai. Allfreevn có khả năng trình bày một cách rõ ràng, dễ hiểu và hấp dẫn để giúp người đọc hoặc người tham gia hiểu và áp dụng kiến thức vào thực tế. Mục tiêu của tác giả allfreevn là chia sẻ kiến thức là lan truyền và phổ biến kiến thức, giúp mọi người tiếp cận và hiểu biết về các lĩnh vực khác nhau. Allfreevn có thể cung cấp hướng dẫn, lời khuyên và phân tích chi tiết để giải thích các khái niệm phức tạp thành một cách dễ hiểu và ứng dụng được.

Bình luận gần đây