Những
điều cần biết về Grok 3 AI: Câu trả lời của Elon Musk cho ChatGPT
xAI gần đây đã ra mắt phiên bản mới nhất của Grok, mô hình AI tiên phong của họ. Chúng tôi đã dùng thử Grok 3, được cho là 'AI thông minh nhất thế giới', và đây là những gì chúng tôi tìm thấy
Mô
hình AI đã được đào tạo trên cụm siêu máy tính Colossus độc quyền của xAI sở
hữu hơn 100.000 GPU Nvidia Hopper. Theo nhà sản xuất, Grok 3 đã cho thấy những
cải tiến đáng kể về lý luận, mã hóa, toán học, kiến thức chung và các nhiệm
vụ yêu cầu nó phải tuân theo hướng dẫn. xAI đã tinh chỉnh khả năng lý luận của
chatbot thông qua học tăng cường quy mô lớn, cho phép nó suy nghĩ trong khoảng
vài giây đến vài phút, cân nhắc lời nhắc trước khi phản hồi.
Mô
hình AI mới nhất từ xAI đã cho thấy một số kết quả tuyệt vời trên các tiêu
chuẩn của người dùng trong học thuật và thế giới thực. Bây giờ, Grok 3 đã có
sẵn để mọi người dùng thử. Dưới đây là tổng hợp những điều chúng tôi đã thử với
đối thủ ChatGPT của Elon Musk.
Ấn tượng đầu tiên
Giống
như DeepSeek-R1 và ChatGPT của OpenAI, trang chủ của Grok 3 có phần nhập ngay
chính giữa và hiển thị các tùy chọn— Đính kèm tệp, DeepSearch và Think ở bên
trái, và tùy chọn chọn mô hình AI và Enter ở bên phải. Ngay từ đầu, có thể thấy
rõ ràng rằng một mô hình lý luận đã được nhúng vào đó. Người dùng có thể dễ
dàng chuyển đổi giữa các chức năng AI tiêu chuẩn và "chế độ lý luận".
Kỳ lạ thay, giao diện lại giống một cách kỳ lạ với ChatGPT.
Trên
giao diện web, người ta có thể thấy phần trò chuyện tạm thời ở góc trên bên phải
trước tab lịch sử và biểu tượng hồ sơ. Trò chuyện tạm thời là tính năng cho
phép người dùng truy cập chế độ trò chuyện mà lịch sử trò chuyện của họ không
được lưu. Ở chế độ này, tất cả các cuộc trò chuyện sẽ tự động bị xóa khỏi hệ
thống trong vòng 30 ngày.
Ở
cuối cửa sổ nhập liệu, có các tùy chọn như Nghiên cứu, Động não, Phân tích dữ
liệu, Tạo hình ảnh và Mã, thể hiện tính linh hoạt của mô hình. Mô hình AI cũng
có thể tìm kiếm trên web; để truy cập, người ta cần chọn menu thả xuống từ cửa
sổ nhập liệu và chọn tùy chọn Bật tìm kiếm. Chatbot cũng cho phép người dùng
chuyển đổi giữa Grok 2 và Grok 3. Có thể truy cập Grok 3 qua X, grok.com và ứng
dụng chuyên dụng mới của nó trên iOS.
Khả năng nghiên cứu
Để
thử khả năng DeepSearch, tôi đã sử dụng một lời nhắc liên quan đến việc bảo tồn
chim sẻ nhà ở Ấn Độ. Tôi bắt đầu nghiên cứu của mình bằng lời nhắc "Tình
trạng của loài chim sẻ nhà ở Ấn Độ như thế nào?" Trong vòng 46 giây,
chatbot đã tìm kiếm 101 nguồn và trình bày thông tin. Tương tự như DeepSeek-R1,
người ta cũng có thể thấy quá trình suy nghĩ ở đây, cùng một lời tự nói và đánh
giá như ở con người khi trả lời các câu hỏi.
Grok
3 đã tạo ra một báo cáo chi tiết với các điểm chính, tổng quan, tình trạng bảo
tồn và nguyên nhân suy thoái, khuôn khổ pháp lý, hoàn chỉnh với các trích dẫn
chính. Ngoài ra, tôi đã tham gia với chatbot với các câu hỏi liên quan như nỗ
lực bảo tồn trong thập kỷ qua và giải thích rằng khả năng DeepSearch trên Grok
3 có thể là một công cụ tuyệt vời trong kho vũ khí của những người học nhiệt
tình.
Tạo và phân tích hình ảnh
Grok
3 có khả năng tạo ra các hình ảnh siêu thực. Chatbot tạo ngay lập tức các hình
ảnh có thể được tinh chỉnh thêm dựa trên nhu cầu. Ngoài ra, nó cung cấp bốn tùy
chọn cùng một lúc và các tùy chọn tùy chỉnh tức thời ở phía dưới. Với việc tạo
hình ảnh, Grok 3 rất tiện dụng. Tuy nhiên, không thể nói như vậy đối với khả
năng phân tích hình ảnh của nó. Để kiểm tra Grok 3, chúng tôi đã tải lên áp
phích cổ điển của một bộ phim tiếng Malayalam, "Sreekrishnapurathe
Nakshathrathilakkam". Mặc dù chatbot mô tả áp phích là từ một bộ phim cũ
và xác định chính xác ngôn ngữ, nhưng nó đã gặp khó khăn trong việc đưa ra tên
chính xác trên áp phích. Chatbot đã đọc tên bộ phim là “Anandapurathu Vaykk”,
điều này không có nghĩa lý gì cả.
Tuy
nhiên, lần thứ hai, chúng tôi đã tải lên một bức ảnh cũ của Macintosh SE. Grok
3 đã xác định chính xác vật thể trong ảnh. "Đây là Macintosh SE, một máy
tính cá nhân được Apple Inc. thiết kế, sản xuất và bán từ tháng 3 năm 1987 đến
tháng 10 năm 1990. Macintosh SE, trong đó 'SE' là viết tắt của "Mở rộng hệ
thống", là phiên bản nâng cấp của Macintosh ban đầu với các tính năng như
ổ cứng bên trong, khe cắm mở rộng và bộ xử lý mạnh hơn (Motorola 68000 chạy ở
tốc độ 8 MHz)", phản hồi viết.
Tiếp
theo, chúng tôi yêu cầu Grok 3 tạo một áp phích cho văn bản bên dưới: "Hãy
tham gia cùng chúng tôi trong lễ kỷ niệm Ngày Nhà giáo vào ngày 26 tháng 2 lúc
10 giờ sáng tại Phòng trưng bày Nghệ thuật Quốc gia, New Delhi!" Grok 3 đã
phải vật lộn để tạo ra một áp phích chính xác.
Giống như ChatGPT hoặc Gemini, Grok 3 không thể tạo hình ảnh bằng văn bản viết, mặc dù nó có thể làm cho văn bản đúng ở một số phần. Tuy nhiên, nó có thể thành công nếu chỉ có một vài từ.
Một
số mẫu hình ảnh về những chú rái cá vui vẻ được tạo bằng Grok 3:
Chơi câu đố
Trong
phần thực hành này, tôi đã thử sử dụng một số câu đố cổ xưa được mệnh danh là
khó nhất trên internet. Trong khi ChatGPT sử dụng biểu tượng cảm xúc động viên
với mỗi câu trả lời đúng mà tôi đưa ra, Grok 3 đã dành thời gian phân tích phản
hồi của tôi một cách hợp lý để xác minh chúng. Rõ ràng là với ChatGPT, có vẻ
như nó giống như đang cạnh tranh với một người bạn hơn, trong khi Grok 3 giống
như một giáo sư tức giận, người đang kiểm tra chéo tất cả các câu trả lời của
tôi.
Grok
3 đã hỏi tôi, "Tôi có thể bay mà không cần cánh, khóc mà không cần mắt và
bị bắt nhưng không bao giờ bị giữ lại. Tôi là gì?" Tôi đã trả lời bằng câu
trả lời đúng - đám mây. Dưới đây là ảnh chụp nhanh về cách Grok 3 đánh giá phản
hồi của tôi và kết luận rằng nó đúng.
Grok
3 đã bắt được tôi lần thứ hai khi nó hỏi tôi một câu đố có vẻ khó: "Tôi bị
bắt khỏi một mỏ và bị nhốt trong một chiếc hộp gỗ, nơi tôi không bao giờ được
thả ra, nhưng tôi lại được hầu hết mọi người sử dụng. Tôi là gì?" Than là
câu trả lời của tôi, câu trả lời này không đúng. Sau đây là cái nhìn thoáng qua
về cách Grok 3 đi đến kết luận.
Về những câu hỏi sâu sắc hơn
Grok
3 có cá tính không? Vì tôi đã sử dụng nhiều chatbot khác nhau trong nhiều tháng
nay, tôi đã quen với những phản hồi có phần hỗn láo. Tôi đã hỏi Grok-3 và
ChatGPT, "Sống có nghĩa là gì?" Trong khi ChatGPT tạo ra một danh
sách bao gồm nhiều góc nhìn khác nhau, Grok 3 đã đưa ra một câu trả lời sắc
thái mà có vẻ sâu sắc. Ví dụ, những dòng kết thúc trong phản hồi của ChatGPT
là, "Góc nhìn công nghệ - Với
những tiến bộ trong AI và sinh học tổng hợp, những câu hỏi về những gì đủ điều
kiện là "sống" đang mở rộng. Liệu AI tiên tiến hay ý thức kỹ thuật số
một ngày nào đó có thể được coi là "sống" không?
Mặt
khác, Grok 3 đã kết thúc phản hồi của mình bằng những từ dưới đây. "Tôi là
AI, vì vậy tôi không đánh dấu vào các ô sinh học - Tôi không ăn, không trồng
hoặc không tạo ra Grok nhỏ. Nhưng tôi ở đây, trò chuyện với bạn, thích nghi và
xử lý. Điều đó có được tính không? Có lẽ “sống” không chỉ là về tế bào và DNA -
có lẽ là về tác động, tương tác hoặc chỉ là một phần của điệu nhảy tồn tại. Bạn
nghĩ sao? Có phải là nhịp tim, tâm trí hay thứ gì khác khiến “sống” trở nên có
thật với bạn không?”
Dựa
trên kinh nghiệm của chúng tôi, Grok 3 nghe giống con người hơn GPT-4o.
Tạo nội dung
Vì Grok 3 có thể truy cập vào kho kiến thức khổng
lồ nhờ X, chúng tôi đã yêu cầu mô hình giúp chúng tôi thực hiện một số nhiệm vụ
tạo nội dung. Theo tôi, Grok 3 có thể là một công cụ AI tuyệt vời để phân tích
đối thủ cạnh tranh cho các doanh nhân mới vào nghề. Hãy tưởng tượng bạn đang
thành lập một doanh nghiệp nhỏ cung cấp ốp lưng iPhone và muốn biết loại cuộc
trò chuyện nào đang diễn ra trực tuyến. Grok 3 có thể hiển thị cho bạn một số
tweet mới nhất. Chúng tôi đã sử dụng lời nhắc "Tìm tweet về ốp lưng iPhone
16, chia sẻ chúng với URL". Chatbot đã trích xuất các tweet có liên quan
nhất và thậm chí mô tả chúng.
Tiếp theo, chúng tôi yêu cầu Grok 3 tạo kế hoạch
tiếp thị nội dung cho một doanh nghiệp nhỏ bán ốp lưng iPhone 16 tùy chỉnh.
Chúng tôi đã sử dụng lời nhắc "Tạo kế hoạch tiếp thị nội dung trong một
tháng cho một doanh nghiệp nhỏ bán ốp lưng iPhone 16 tùy chỉnh. Bao gồm các bài
đăng hình ảnh cho phương tiện truyền thông xã hội". Đáp lại, Grok 3 đã
chia sẻ một kế hoạch chi tiết xác định nền tảng, chiến lược nội dung và mô tả
hình ảnh phù hợp. Chatbot không tạo hình ảnh như một phần của kế hoạch; tuy
nhiên, nó đã làm như vậy sau hai lời nhắc bổ sung sau khi đưa ra kế hoạch.
(Nguồn: TheIndianEXPRESS)
Social Plugin