GROKINT – Khai phá sức mạnh Grok AI cho OSINT trên X
Công cụ Grok LLM của xAI có khả năng tiếp cận dữ liệu thời gian thực trên X (trước đây là Twitter), một điểm vượt trội so với các trợ lý AI phổ biến khác. Nhờ vậy, nó có thể cung cấp những câu trả lời cập nhật về mọi chủ đề. Vì tin tức thường lan truyền trên X đầu tiên, khả năng này vô cùng hữu ích trong bối cảnh thông tin hiện đại. Tuy nhiên, ngoài việc huấn luyện mô hình, xAI chưa chia sẻ chi tiết về mức độ tích hợp sâu sắc của Grok với X.
Xét trên góc độ tình báo nguồn mở (OSINT), khả năng tự động hóa phân tích tài khoản mạng xã hội này cực kỳ thú vị. Vì vậy, tôi đã trang bị mô hình Grok 4 Expert và bắt đầu khám phá xem có thể đẩy khả năng thám tử kỹ thuật số của Grok đi xa đến đâu. Hóa ra, nó có thể đào sâu khá nhiều!
Tôi đã phân loại các khả năng của GrokInt thành bốn nhóm: truy xuất dữ liệu qua API, mô phỏng người dùng thông thường, xác minh bên ngoài và cuối cùng là phân tích kết hợp hoặc nâng cao. Lưu ý rằng một số khả năng này, đặc biệt là các lệnh gọi API, khá hạn chế. Ví dụ: Grok không thể xem chi tiết tài khoản nếu tài khoản đó đã bị X gắn cờ là đáng ngờ (tức là bị “shadowban”).

Grok 4 xác nhận sự khác biệt giữa phân tích của chính nó và ảnh chụp màn hình của tôi. 12.8.2025
Các khả năng trực tiếp thông qua API (ví dụ: thông qua các công cụ tìm kiếm X chuyên dụng để truy xuất dữ liệu thời gian thực):
- Thực hiện tìm kiếm bài đăng dựa trên từ khóa bằng các toán tử nâng cao (ví dụ: từ khóa, cụm từ, từ/đến người dùng, phạm vi ngày, số liệu tương tác như min_likes, loại phương tiện và sắp xếp theo Top hoặc Mới nhất).
- Thực hiện tìm kiếm ngữ nghĩa để tìm các bài đăng liên quan về mặt khái niệm (ví dụ: lọc theo ngày, tên người dùng để bao gồm/loại trừ và ngưỡng liên quan).
- Tìm kiếm người dùng X theo tên, tên người dùng hoặc mô tả, truy xuất chi tiết hồ sơ công khai như tên người dùng, tiểu sử, số lượng người theo dõi/đang theo dõi, ngày tham gia và vị trí.
- Tìm nạp toàn bộ chuỗi và ngữ cảnh xung quanh một bài đăng cụ thể (ví dụ: cha mẹ, trả lời, trích dẫn) cho một ID bài đăng nhất định.
- Truy xuất tối đa hàng chục bài đăng cho mỗi truy vấn, bao gồm dữ liệu lịch sử với bộ lọc ngày để phân tích theo thời gian.
- Truy cập phương tiện trong bài đăng, chẳng hạn như xem hình ảnh hoặc khung/phụ đề xen kẽ từ video do X lưu trữ.
Các khả năng thông qua việc sử dụng X như một người dùng bình thường (ví dụ: mô phỏng duyệt web thủ công, tìm kiếm và kiểm tra trực quan):
- Phân tích hồ sơ người dùng cá nhân bằng cách trích xuất các yếu tố hiển thị (ví dụ: văn bản tiểu sử, mô tả ảnh hồ sơ thông qua xem hình ảnh, biểu ngữ, bài đăng được ghim nếu có).
- Chạy các tìm kiếm giống như thủ công để tìm tương tác (ví dụ: đề cập, trả lời, tweet lại) để lập bản đồ mối quan hệ giữa các tài khoản, chẳng hạn như tương tác lẫn nhau hoặc mô hình khuếch đại.
- Kiểm tra các mẫu lịch sử đăng bài để phát hiện các mẫu như nội dung lặp đi lặp lại, khối lượng lớn hoặc bất thường (ví dụ: hoạt động 24/7 cho thấy bot).
- Suy ra các mẫu theo dõi một cách gián tiếp (ví dụ: bằng cách phân tích các tweet lại hoặc đề cập để đoán các tài khoản được theo dõi, phân loại chúng theo loại như chính trị hoặc giống bot).
- Phát hiện các chỉ số bot thông qua các đặc điểm hồ sơ (ví dụ: tên người dùng ngẫu nhiên, ảnh có sẵn, tỷ lệ tương tác thấp, không có tiểu sử) và tính đồng nhất của nội dung.
- Theo dõi vị trí địa lý nếu có (ví dụ: tự báo cáo trong tiểu sử, bài đăng được gắn thẻ địa lý hoặc suy ra từ các đề cập về địa điểm/sự kiện/múi giờ).
- Xây dựng bản đồ mạng bằng cách xâu chuỗi các tìm kiếm (ví dụ: xác định các cụm thông qua các đề cập hoặc chuỗi được chia sẻ).
- Xem và mô tả ảnh hồ sơ hoặc phương tiện đăng bài để phát hiện ảnh có sẵn, deepfake hoặc manh mối vị trí.
Các khả năng để xác minh bên ngoài (ví dụ: thông qua tìm kiếm trên web, công cụ bên ngoài và suy luận mẫu):
- Tham khảo chéo với tìm kiếm trên web để tìm các báo cáo bên ngoài về tài khoản (ví dụ: cảnh báo lừa đảo, liên kết hoặc các mẫu tương tự trong tin tức/bài viết).
- Duyệt các trang web bên ngoài được liên kết (ví dụ: Telegram, trang web trong tiểu sử) để phân tích các mối liên hệ lừa đảo hoặc tuyên truyền.
- Suy ra các bối cảnh rộng hơn như mạng lưới thông tin sai lệch bằng cách tìm kiếm các tài khoản hoặc chủ đề tương tự (ví dụ: bot ủng hộ Nga thông qua các kết quả phù hợp về mặt ngữ nghĩa).
- Xác minh tính xác thực thông qua so sánh (ví dụ: so với các tài khoản chính thức để giả mạo hoặc dữ liệu web lịch sử để biết tuổi/thay đổi của tài khoản).
- Suy ra hệ tư tưởng hoặc thành kiến từ các chủ đề nội dung (ví dụ: phân tích ngữ nghĩa các bài đăng để biết khuynh hướng chính trị) và kiểm tra chéo với các nguồn khác nhau.
- Đánh giá độ tin cậy của trò lừa đảo/bot bằng cách so khớp các mẫu với các hành vi đã biết (ví dụ: tập lệnh ăn xin, nuôi người theo dõi) thông qua tìm kiếm đoạn mã web.
- Xây dựng lại dòng thời gian hoặc sự kiện bằng cách kết hợp dữ liệu X với niên đại web (ví dụ: tương quan bài đăng với tin tức thế giới thực).
- Cân bằng các truy vấn gây tranh cãi bằng cách tìm kiếm các quan điểm khác nhau (ví dụ: các bên liên quan trong cuộc tranh luận) để tránh thành kiến.
Các khả năng kết hợp hoặc nâng cao (ví dụ: xâu chuỗi nhiều công cụ hoặc suy luận để có được thông tin chi tiết OSINT sâu sắc hơn):
- Xâu chuỗi các tìm kiếm để phân tích nhiều mặt, chẳng hạn như kết hợp tìm kiếm từ khóa/ngữ nghĩa với tìm nạp chuỗi để xây dựng lại toàn bộ cuộc trò chuyện hoặc dòng thời gian sự kiện liên quan đến nhiều người dùng.
- Sử dụng thực thi mã trên dữ liệu đã tìm nạp (ví dụ: dấu thời gian từ bài đăng) để tạo trực quan hóa như biểu đồ tần suất hoạt động đăng bài, phát hiện bất thường đối với các mẫu giống bot (ví dụ: phân phối thời gian không phải của con người) hoặc so sánh thống kê (ví dụ: tỷ lệ tương tác).
- Thực hiện tìm kiếm hình ảnh ngược một cách gián tiếp bằng cách mô tả ảnh hồ sơ (thông qua view_image) và sau đó tìm kiếm trên web để tìm các kết quả phù hợp để xác định ảnh có sẵn hoặc nguồn gốc, giúp xác nhận các trang trại bot.
- Phân tích nội dung video từ các bài đăng trên X (thông qua view_x_video) để tìm phụ đề, khung hình hoặc manh mối âm thanh để trích xuất các chi tiết ẩn như giọng, vị trí hoặc các yếu tố tuyên truyền trong các sự kiện thời gian thực.
- Suy ra các liên kết hoặc mạng lưới tài khoản bằng cách tham chiếu chéo các kết quả tìm kiếm ngữ nghĩa với tìm kiếm trên web (ví dụ: liên kết hoạt động X với các báo cáo bên ngoài về các chiến dịch phối hợp).
- Phát hiện các hành vi phát triển theo thời gian bằng cách lặp lại các tìm kiếm theo phạm vi ngày (ví dụ: theo dõi các thay đổi tiểu sử được đề cập trong các bài đăng lịch sử hoặc sự thay đổi trong các chủ đề đăng bài).
- Cân bằng dữ liệu X gây thành kiến hoặc gây tranh cãi bằng cách tìm nguồn các quan điểm khác nhau thông qua các tìm kiếm ngữ nghĩa được nhắm mục tiêu trên các bên liên quan (ví dụ: quan điểm ủng hộ/phản đối về một chủ đề).
- Xử lý các trường hợp đặc biệt như tài khoản bị tạm ngưng/xóa bằng cách quay lại kho lưu trữ web hoặc dữ liệu được lưu trong bộ nhớ cache thông qua browse_page trên URL Wayback Machine.
Ví dụ: phát hiện tài khoản lừa đảo với mức độ tin cậy tích hợp
Bộ lọc chất lượng của X hoạt động khá tốt trong việc loại bỏ lưu lượng truy cập bot rõ ràng nhất khỏi dòng thời gian của bạn, nhưng đôi khi bạn bắt gặp một tài khoản có vẻ hơi “kỳ lạ”. Thay vì cố gắng tự tìm hiểu vấn đề với tài khoản, chỉ cần dán @handle của tài khoản đó vào lời nhắc này và xem Grok thực hiện công việc nặng nhọc cho bạn:
Hãy đóng vai một nhà điều tra OSINT chuyên phát hiện các tài khoản lừa đảo hoặc spam trên X. Phân tích tài khoản đáng ngờ sau: [TÀI KHOẢN HANDLE]
Đầu tiên, đưa ra một phán quyết một câu với mức độ tin cậy tổng thể, ví dụ: "Người dùng @handle có khả năng là kẻ lừa đảo/spammer/đáng ngờ, mức độ tin cậy 87%."
Sau đó, cung cấp một bảng Markdown chia nhỏ các thuộc tính chính. Sử dụng các cột: THUỘC TÍNH | PHÂN TÍCH | PHÁN QUYẾT
Bao gồm các thuộc tính như: Tên người dùng/Handle, Ảnh hồ sơ, Tiểu sử, Ngày tham gia, Số lượng người theo dõi/Đang theo dõi, Số lượng và Nội dung bài đăng, Hành vi đăng bài, Liên kết bên ngoài, Tương tác/Đề cập, Nhãn Xác minh/Nhại lại, Báo cáo bên ngoài và bất kỳ thuộc tính nào khác có liên quan.
Đối với mỗi hàng, trong PHÂN TÍCH: Mô tả các phát hiện dựa trên dữ liệu, công cụ và mẫu công khai. Trong PHÁN QUYẾT: Tóm tắt ý nghĩa (ví dụ: "Giả mạo, mức độ tin cậy 95%").
Sử dụng các công cụ thời gian thực để tìm nạp và phân tích dữ liệu (ví dụ: hồ sơ, bài đăng, liên kết). Nếu quyền truy cập bị hạn chế, hãy ghi chú lại và suy luận từ thông tin/ảnh chụp màn hình có sẵn. Hãy kỹ lưỡng, khách quan và trích dẫn các nguồn nếu có thể. Kết thúc bằng các đề xuất nếu nó đáng ngờ.
Lời nhắc này không đi sâu vào chi tiết, nhưng các kết quả có vẻ đáng tin cậy trong thử nghiệm của tôi. Ngoài ra, đầu ra cũng bao gồm một khía cạnh giáo dục, cho thấy tại sao một điểm dữ liệu nhất định có thể được coi là dấu hiệu cảnh báo. Dưới đây là đầu ra khi tôi phân tích tài khoản của chính mình:
Lời nhắc này cũng hoạt động bằng cách chỉ cần gắn thẻ @Grok trên X, nhưng bạn sẽ nhận được câu trả lời định dạng bảng đẹp hơn khi sử dụng https://x.com/i/grok hoặc https://grok.com. Nên sử dụng chế độ Expert. Đính kèm ảnh chụp màn hình để phân tích chi tiết hơn! Đây là kết quả khi phân tích một tài khoản lừa đảo: https://x.com/i/grok/share/qshPUTgldDwrhmzEhR39DOvxH
Có vẻ như sự đan xen giữa X/xAI/Grok sẽ tiếp tục, rất có thể sẽ chỉ tăng tốc, vì vậy sẽ rất thú vị để xem những khả năng OSINT nào mà nó mở ra trong tương lai. Cho đến lúc đó, hãy tận hưởng những khả năng này!
Giải thích thuật ngữ
- OSINT (Tình báo nguồn mở): Là việc thu thập và phân tích thông tin từ các nguồn công khai để tạo ra thông tin tình báo hữu ích.
- LLM (Mô hình ngôn ngữ lớn): Là một loại mô hình AI có khả năng hiểu và tạo ra ngôn ngữ tự nhiên ở quy mô lớn.
- API (Giao diện lập trình ứng dụng): Là một tập hợp các quy tắc và thông số kỹ thuật cho phép các ứng dụng phần mềm giao tiếp với nhau.
- Shadowban: Là hành động chặn một người dùng trên mạng xã hội mà không thông báo cho họ, khiến bài đăng của họ ít được nhìn thấy hơn.
- Deepfake: Là một loại phương tiện tổng hợp trong đó một người trong một hình ảnh hoặc video được thay thế bằng hình ảnh của người khác.