Tuần này trong lĩnh vực Trí tuệ Nhân tạo: Vấn đề duy trì tài năng của OpenAI

Xin chào, mọi người, chào mừng đến với bản tin AI định kỳ của TechCrunch.

Tuần này trong lĩnh vực AI, OpenAI đã mất một cộng sự khác.

John Schulman, người đã đóng vai trò quan trọng trong việc phát triển ChatGPT, nền tảng chatbot dựa trên trí tuệ nhân tạo của OpenAI, đã rời công ty để chuyển sang Anthropic, một đối thủ cạnh tranh. Schulman thông báo tin này trên X, nói rằng quyết định của anh ta xuất phát từ mong muốn tập trung sâu hơn vào việc cân chỉnh AI - khoa học đảm bảo AI hoạt động như dự định - và tham gia vào công việc kỹ thuật nhiều hơn.

Nhưng đôi khi không thể không tự hỏi liệu việc Schulman rời đi, đồng thời khi Tổng giám đốc OpenAI Greg Brockman nghỉ phép kéo dài đến cuối năm, có phải đã ăn trọn cơ hội hay không.

Vào cùng ngày Schulman thông báo việc rời đi của mình, OpenAI tiết lộ rằng họ dự định thay đổi định dạng của sự kiện DevDay của mình trong năm nay, chọn các phiên tương tác với các nhà phát triển trên đường đi thay vì một sự kiện một ngày đầy sôi động. Một người phát ngôn thông báo với TechCrunch rằng OpenAI sẽ không thông báo một mô hình mới trong DevDay, ngụ ý rằng công việc phát triển một kế tự trạng thái mới thay cho sản phẩm cờ của công ty hiện tại, GPT-4o, đang tiến triển chậm chạp. (Sự trì hoãn của GPU Blackwell của Nvidia có thể làm chậm quy trình hơn nữa.)

Liệu OpenAI có gặp vấn đề không? Schulman có nhìn thấy điều mà mọi người đã dự đoán chưa? Với tình hình tại đế chế của Sam Altman, không thể phủ nhận rằng tương lai lúc này chắc chắn u ám hơn so với một năm trước.

Ed Zitron, chuyên gia PR và tiên tri công nghệ tổng thể, đã trình bày trong bản tin của mình gần đây những khó khăn đang đứng giữa OpenAI và thành công tiếp tục. Đây là một bài viết được nghiên cứu kỹ lưỡng và chi tiết, và tôi không muốn lạm dụng nó bằng cách lặp lại nội dung. Nhưng những điểm Zitron đề cập đến áp lực ngày càng tăng cho OpenAI phải thể hiện đáng chú ý.

OpenAI dự kiến sẽ mất 5 tỷ đô la trong năm nay. Để bù đắp cho việc tăng chi phí về nhân sự (các nhà nghiên cứu AI rất, rất đắt), huấn luyện mô hình và cung cấp mô hình hàng loạt, công ty sẽ phải huy động một số tiển lớn trong vòng 12 đến 24 tháng tới. Microsoft sẽ là người hưởng lợi rõ rệt; họ sở hữu 49% cổ phần trong OpenAI và, mặc dù có lúc cạnh tranh, mối quan hệ làm việc chặt chẽ với các nhóm sản phẩm của OpenAI. Nhưng với chi phí đầu tư của Microsoft tăng 75% so với năm trước (lên 19 tỷ đô) để chuẩn bị cho các lợi nhuận từ AI mà chưa xuất hiện, liệu họ có thực sự mong muốn đầu tư thêm hàng tỷ đô vào một cược cá rủ lâu dài, rủi ro?

Phóng viên này sẽ ngạc nhiên nếu OpenAI, công ty AI nổi tiếng nhất thế giới, không thể huy động được tiền cần thiết từ một nơi nào đó cuối cùng. Tuy nhiên, khả năng cao hội sống sót này sẽ đi kèm với điều kiện không thuận lợi hơn, và có lẽ sự thay đổi đã lâu đồn đoán về cấu trúc lợi nhuận hạn chế của công ty.

Việc sống sót có thể có nghĩa là OpenAI sẽ di chuyển xa hơn so với sứ mệnh ban đầu và vào lĩnh vực không định rõ và không chắc chắn. Và có thể đó là điều quá khó nhọc mà Schulman (và đồng đội) không chấp nhận. Khó mà đổ lỗi cho họ; với sự nghi ngờ từ các nhà đầu tư và doanh nghiệp tăng lên, toàn bộ ngành công nghiệp AI, không chỉ riêng OpenAI, đều đối mặt với một sự gián đoạn.

Tin tức

Trí tuệ của Apple có giới hạn: Apple đã cho người dùng một cái nhìn đầu tiên thực sự về tính năng Trí tuệ của Apple với việc phát hành phiên bản beta của nhà phát triển iOS 18.1 tháng trước. Nhưng như Ivan viết, tính năng Công cụ Viết gặp khó khăn khi đụng đến tục ngữ và chủ đề nhạy cảm, như ma túy và ám sát.

Termostat Học Nest của Google được đổi mới: Sau chín năm dài, Google cuối cùng cũng làm mới thiết bị đã mang lại tên tuổi cho Nest. Công ty đã thông báo ra mắt Termostat Học Nest 4 vào thứ Ba - 13 năm sau khi ra mắt phiên bản gốc và gần 10 năm sau Termostat Học 3 và trước sự kiện Made by Google 2024 vào tuần tới.

Chatbot của X lan truyền tin sai lệch trong bầu cử: Grok đã lan truyền thông tin sai lệch về Phó Tổng thống Kamala Harris trên X, mạng xã hội trước đây được biết đến với tên là Twitter. Đó là theo một bức thư công khai viết bởi năm thị trưởng bang và gửi cho Elon Musk, CEO của Tesla, SpaceX và X, khẳng định rằng chatbot dựa trên trí tuệ nhân tạo của X sai lạc khi gợi ý rằng Harris không đủ điều kiện xuất hiện trong một số phiếu bầu tổng thống Mỹ năm 2024.

YouTuber kiện OpenAI: Một nhà sáng tạo YouTube đang cố gắng đưa ra một vụ kiện tập thể đối với OpenAI, cáo buộc công ty đã huấn luyện các mô hình AI sinh sáng của mình trên hàng triệu bản ghi âm từ video YouTube mà không thông báo hoặc bồi thường cho các chủ sở hữu của video đó.

Hoạt động vận động dự luật của AI đang tăng cường: Hoạt động vận động dự luật về AI tại cấp liên bang Hoa Kỳ đang cực kỳ tăng trong bối cảnh bùng nổ của AI sinh sáng tiếp tục và một năm bầu cử có thể ảnh hưởng đến quy định AI trong tương lai. Số lượng nhóm vận động dự luật cho chính phủ liên quan đến AI đã tăng từ 459 vào năm 2023 lên 556 trong nửa đầu năm 2024, từ tháng 1 đến tháng 7.

Tiểu sử nghiên cứu hàng tuần

“Mô hình Mở” như gia đình Llama của Meta, có thể sử dụng nhiều hay ít tùy ý của các nhà phát triển, có thể kích thích sáng tạo - nhưng cũng có rủi ro. Chắc chắn, nhiều mô hình có giấy phép áp đặt hạn chế, cũng như bộ lọc an toàn và trang thiết bị tích hợp sẵn. Nhưng ngoài những điều đó, không có gì ngăn cản người dùng xấu sử dụng các mô hình mở để lan truyền thông tin sai lệch, ví dụ, hoặc tạo ra một trang nông trại nội dung.

Có thể sẽ có trong tương lai.

Một nhóm nghiên cứu đến từ Harvard, Trung tâm An toàn AI phi lợi nhuận và những nơi khác đề xuất trong một văn bản kỹ thuật một phương pháp “chống biến đổi” để duy trì “khả năng tốt” của một mô hình trong khi ngăn mô hình hoạt động một cách không mong muốn. Trong các thí nghiệm, họ đã thấy phương pháp của họ hiệu quả trong việc ngăn chặn “tấn công” vào các mô hình (như lừa nó cung cấp thông tin mà nó không nên cung cấp) với chi phí nhỏ về độ chính xác của một mô hình.

Tuy nhiên có một cái “bẫy”. Phương pháp này không mở rộng tốt cho các mô hình lớn hơn do “thách thức tính toán” yêu cầu “tối ưu hóa” để giảm chi phí cản trở, các nhà nghiên cứu giải thích trong văn bản. Vì vậy, mặc dù công việc sớm có triển vọng, không mong đợi thấy nó triển khai sớm.

Mô hình của tuần

Một mô hình tạo hình ảnh mới đã xuất hiện gần đây, và dường như đang khiến các đối thủ như Midjourney và DALL-E 3 phải tỏ ra lo lắng.

Được gọi là Flux.1, mô hình - hay chính xác hơn, gia đình mô hình - đã được phát triển bởi Black Forest Labs, một công ty khởi nghiệp do các nhà nghiên cứu AI tại Stability AI sáng lập, nhiều trong số họ đã tham gia vào việc tạo ra Diffusion Ổn định và các phiên bản theo sau. (Black Forest Labs đã thông báo vòng gọi vốn đầu tiên của mình tuần trước: 31 triệu đô la được dẫn dắt bởi Andreessen Horowitz.)

Mô hình phức tạp nhất của Flux.1, Flux.1 Pro, đã được đóng cửa lại sau một API. Nhưng Black Forest Labs đã phát hành hai mô hình nhỏ hơn, Flux.1 Dev và Flux.1 Schnell (tiếng Đức có nghĩa là “nhanh”), trên nền tảng phát triển AI Hugging Face với hạn chế nhẹ về việc sử dụng thương mại. Cả hai đều cạnh tranh với Midjourney và DALL-E 3 về chất lượng hình ảnh họ có thể tạo ra và khả năng họ tuân thủ theo chỉ dẫn, Black Forest Labs khẳng định. Và họ đặc biệt giỏi trong việc chèn văn bản vào hình ảnh, một kỹ năng mà các mô hình tạo hình ảnh đã từng không thể thực hiện theo yêu cầu.

Black Forest Labs đã quyết định không chia sẻ dữ liệu nào được sử dụng để huấn luyện các mô hình (điều đó là một lý do để quan ngại do rủi ro về bản quyền cơ bản trong việc tạo hình ảnh AI kiểu này), và công ty khởi nghiệp cũng chưa đi sâu vào cách họ dự định ngăn chặn việc lạm dụng của Flux.1. Hiện tại, họ đang tiếp cận một cách nghiêm túc - vì vậy người dùng hãy cẩn trọng.

Bazaar

Các công ty sinh sáng AI ngày càng chấp nhận phòng vệ sử dụng hợp lý khi huấn luyện các mô hình trên dữ liệu bản quyền mà không có sự chấp thuận của chủ sở hữu của dữ liệu đó. Hãy lấy ví dụ về Suno, nền tảng sinh nhạc AI, chỉ trong thời gian qua đã thuyết phục tòa án rằng họ có quyền sử dụng các bài hát thuộc sở hữu của các nghệ sĩ và hãng thu âm mà không cần sự thông tin của những nghệ sĩ và hãng thu âm đó - và không cần bồi thường cho họ.

Đây cũng được cho là cách suy nghĩ (có thể là ước mơ) của Nvidia. Theo một báo cáo 404 Media từ tuần này, Nvidia đang huấn luyện một mô hình sinh video khổng lồ, mã tên Cosmos, trên nội dung YouTube và Netflix. Ban quản lý cấp cao đã nêu một dự án, họ tin rằng dự án sẽ sống sót qua những cuộc chiến pháp lý