Những điều chưa từng tiết lộ về công cụ theo dõi bí mật của NSA (Phần 2)

Thảo luận trong 'Cyber Security Stories' bắt đầu bởi WhiteHat News #ID:2017, 11/09/20, 04:09 PM.

  1. WhiteHat News #ID:2017

    WhiteHat News #ID:2017 WhiteHat Support

    Tham gia: 20/03/17, 10:03 AM
    Bài viết: 291
    Đã được thích: 100
    Điểm thành tích:
    43
    WhiteHat.vn xin giới thiệu tới các bạn Phần 2 cũng là phần cuối của bài viết. Trong phần này, tác giả Barton Gellman tập trung đi sâu cách thức NSA xử lý dữ liệu thông qua khối lượng dữ liệu, chuỗi liên hệ và tính toán trước.
    ____________________________________________________________________
    Đến đây, tôi muốn trích dẫn định nghĩa về Mainway trong Từ điển SSO, một tài liệu tham khảo bí mật của NSA. Lí do vì sao thì các bạn sẽ biết ngay thôi.

    (TUYỆT MẬT) Mainway, hay Dịch vụ chuỗi liên hệ được tính toán trước Mainway (Mainway Precomputed Contact Chaining Service), là một công cụ phân tích chuỗi liên hệ. Nó giúp các nhà phân tích khám phá mục tiêu bằng cách cho phép họ nhanh chóng và dễ dàng điều hướng lượng siêu dữ liệu truyền thông toàn cầu vốn đang ngày càng tăng. Mainway giúp giải quyết vấn đề về khối lượng dữ liệu trong phân tích mạng truyền thông toàn cầu.

    Có ba thuật ngữ đáng chú ý ở đây: vấn đề về khối lượng dữ liệu, chuỗi liên hệ và tính toán trước.

    NSA thực sự gặp rắc rối với vấn đề về khối lượng dữ liệu. Có quá nhiều thông tin được trao đổi giữa các hệ thống trên toàn cầu. Có quá nhiều thông tin cần xử lý, lưu trữ; quá nhiều thông tin cần nhận về từ các khoảng cách rất xa. Tuy nhiên, trong định nghĩa tôi vừa trích dẫn, vấn đề về khối lượng thực chất đang đề cập đến một thứ khác - thứ gì đó sâu hơn bên trong lõi của cỗ máy giám sát. Đó là cảm giác “thèm ăn không giới hạn” của NSA. Các hệ thống thu thập đã “nhồi nhét” nhiều dữ liệu hơn mức chúng có thể “nhai”. Vấn đề nằm ở việc xử lý chứ không phải lưu trữ.

    Trong một thời gian dài, các quan chức tình báo đã bao biện về sự tồn tại của cơ sở dữ liệu hồ sơ cuộc gọi bằng câu nói của Tổng thống Bush: “Với tôi, nếu có ai đó đang nói chuyện với al Qaeda thì chúng tôi đều muốn biết lý do”.

    Trên thực tế đó hoàn toàn không phải là cách NSA sử dụng các bản ghi cuộc gọi. Chương trình được thiết kế với mục đích tìm hiểu xem những người gọi điện ở Mỹ có liên quan gì đến một âm mưu khủng bố nào đó hay không. Và để làm được điều đó thì NSA đã theo dõi tất cả chúng ta. Thông qua FBI, NSA đã thu thập một danh sách thống kê các cuộc gọi trong 5 năm từ mọi tài khoản có thể tiếp cận. Hàng nghìn tỷ cuộc gọi. Không cần phải làm đến như vậy chỉ để tìm các số điện thoại trên hóa đơn viễn thông của một kẻ xấu nào đó.

    Đây là lúc cần đến “chuỗi liên hệ”. Cụm từ được sử dụng để mô tả một dạng phân tích phức tạp nhằm tìm kiếm các mối quan hệ ẩn giấu, gián tiếp trong các tập dữ liệu rất lớn. Chuỗi liên lạc bắt đầu với một số điện thoại mục tiêu, chẳng hạn như số của Dzhokhar Tsarnaev, kẻ ném bom Boston, và dần dần mở rộng đến những cuộc gọi của những người người trong danh sách liên hệ của Tsarnaev. Cứ tiếp tục như vậy.
    @image.jpg
    Chân dung anh em nhà Tsarnaev - Nguồn: Internet
    Các công cụ phần mềm vẽ bản đồ các bản ghi cuộc gọi dưới dạng “nút” và “cạnh” trên một tấm lưới lớn đến mức trí óc con người, nếu không có sự trợ giúp, không thể tưởng tượng được. Các nút là các chấm trên bản đồ, mỗi nút đại diện cho một số điện thoại. Các cạnh là các đường được nối giữa các nút, mỗi đường biểu thị một lượt gọi. Một công cụ liên quan có tên MapReduce biểu thị hàng nghìn tỷ điểm dữ liệu thành dạng tóm tắt để một nhà phân tích có thể nắm được.

    Lý thuyết mạng gọi bản đồ này là đồ thị xã hội. Đồ thị này mô hình hóa các mối quan hệ và các nhóm xác định sự tương tác của mỗi người với thế giới. Kích thước của đồ thị đã tăng lên theo cấp số nhân khi chuỗi liên hệ phát triển. Việc lập đồ thị các mối quan hệ sẽ bắt đầu từ các địa chỉ liên hệ trực tiếp của một mục tiêu đến các địa chỉ liên hệ của các liên hệ, sau đó là các liên hệ của các liên hệ của các liên hệ. Mỗi bước trong quá trình đó được gọi là một chặng.

    Nhân đôi một xu mỗi ngày và bạn đạt được 1 triệu đô la trong vòng chưa đầy một tháng. Đó là mức tăng trưởng theo cấp số nhân với cơ số là hai. Đồ thị xã hội của mỗi mục tiêu phát triển nhanh hơn nhiều. Nếu một người bình thường gọi điện hoặc được 10 người khác gọi mỗi năm thì mỗi chặng tạo ra sự gia tăng gấp 10 lần trên bản đồ liên hệ của NSA. Trên thực tế, hầu hết chúng ta nói chuyện điện thoại với nhiều hơn 10 người khác.

    John C. Inglis, cựu phó giám đốc NSA, đã làm chứng trước Quốc hội năm 2013 rằng các nhà phân tích của NSA thường “phát triển hai hoặc ba chặng” khi xâu chuỗi cơ sở dữ liệu cuộc gọi. Trong trường hợp này, các nhà khoa học dữ liệu ước tính từ hàng thập niên trước rằng sẽ mất không quá sáu chặng để tìm ra mối liên hệ giữa hai người bất kỳ trên Trái đất. Phát hiện của họ trở nên phổ biến với công chúng qua vở kịch Six Degrees of Separation (Sáu chặng cách biệt) của John Guare (sau đó được chuyển thể thành phim). Ba sinh viên Đại học Albright đã cải tiến bộ phim thành trò chơi “Six Degrees of Kevin Bacon”. Trò chơi sau đó đã truyền cảm hứng cho trang web The Oracle of Bacon để tính toán đường đi ngắn nhất từ ngôi sao của bộ phim Footloose đến bất kỳ đồng nghiệp nào của anh ta ở Hollywood. Trang web vẫn tồn tại khi tôi viết bài này và tạo ra một hướng dẫn thú vị về các chặng cách biệt và rằng chúng có thể đưa bạn đến những đâu.
    41K30fe5IIL._SX316_BO1,204,203,200_.jpg
    Poster phim Sáu chặng cách biệt - Nguồn: Internet
    Bacon đã chia sẻ một danh sách dài các diễn viên. Đây đều là những người có liên kết trực tiếp với anh ấy, một chặng từ chính Bacon. Những diễn viên chưa bao giờ làm việc cùng anh ấy nhưng xuất hiện trong một bộ phim khác với một người đã từng diễn cùng Bacon cách Bacon hai chặng. Scarlett Johansson chưa bao giờ làm việc với Bacon nhưng mỗi người trong số họ đã từng diễn cùng Mickey Rourke: Bacon trong Diner, Johannson trong Iron Man 2. Hai chặng, thông qua Rourke, đã kết nối họ với nhau. Nếu tiếp tục chơi trò này, bạn sẽ phát hiện ra rằng Bacon hiếm khi cách bất kỳ diễn viên nào nhiều hơn hai chặng, bất kể thời gian và thể loại phim. Ở một thị trấn công nghiệp đơn lẻ như Hollywood, các liên kết như thế này có thể có ý nghĩa trực quan. Ngạc nhiên hơn là, khoảng cách di chuyển bằng một hoặc hai chặng qua tập dữ liệu của NSA lớn hơn rất nhiều. Nghiên cứu hàn lâm gợi ý rằng trung bình ba chặng - cùng con số mà Inglis đã đề cập - có thể xác định mối liên hệ giữa hai người Mỹ bất kỳ.

    Chuỗi liên hệ trên quy mô lớn như hồ sơ điện thoại của cả một quốc gia là một nhiệm vụ tính toán phi thường, ngay cả đối với Mainway. Nó kêu gọi lập bản đồ các chấm và các cụm cuộc gọi dày đặc như trường sao, mỗi điểm được liên kết với nhau bằng mạng lưới các đường phức tạp. Công cụ phân tích của Mainway đã lần theo các con đường ẩn giấu trên bản đồ, tìm kiếm các mối quan hệ mà các nhà phân tích là con người không thể phát hiện ra. Mainway phải tạo ra bản đồ đó theo yêu cầu, dưới áp lực về thời gian, bất cứ khi nào các nhà điều hành của nó yêu cầu một chuỗi liên hệ mới. Không ai có thể đoán được tên hay số điện thoại của Tsarnaev tiếp theo. Nếu ai đó có thể trở thành mục tiêu tình báo, Mainway nên cố gắng bắt đầu với tất cả mọi người.

    “Bạn phải thiết lập tất cả các mối quan hệ đó, gắn thẻ chúng để khi khởi chạy truy vấn, bạn có thể nhanh chóng nhận được kết quả”, Rick Ledgett, cựu phó giám đốc NSA, nói với tôi nhiều năm sau đó. “Nếu không, bạn sẽ mất cả tháng để xem qua hóa đơn điện thoại hàng nghìn tỷ đồng”. Đây là lúc cần đến “tính toán trước”. Mainway liên tục lập các chuỗi liên hệ từ cơ sở dữ liệu - “hoạt động 7x24”. Việc đó cũng giống như lập chỉ mục một cuốn sách - một cuốn sách có hàng trăm triệu chủ đề (số điện thoại) và hàng nghìn tỷ mục (cuộc gọi điện thoại). Có một điểm không giống nhau, đây là một công việc có thể được hoàn thành. Công việc của Mainway không bao có hồi kết. Nó giống như lập chỉ mục một cuốn sách đang được viết, mãi mãi không hoàn thành. FBI mang về cho NSA hơn một tỷ hồ sơ mới mỗi ngày từ các công ty điện thoại. Mainway đã phải xử lý thêm một tỷ mỗi ngày để tuân thủ giới hạn 5 năm lưu giữ của Tòa án FISA. Mọi thay đổi sẽ đều được đưa lên biểu đồ xã hội, khiến Mainway phải vẽ lại bản đồ và cập nhật liên tục.

    Nói cách khác, mục đích của Mainway không phải là lưu trữ hay chuẩn bị một danh sách đơn giản. Các hoạt động liên tục, phức tạp và đòi hỏi cao là để cung cấp cho một cơ sở dữ liệu khác được gọi là Graph-in-Memory.

    Khi quả bom ở Boston phát nổ vào tháng 4 năm 2013, Graph-in-Memory đã sẵn sàng với một bản đồ tóm tắt các liên hệ từ các cuộc gọi của anh em nhà Tsarnaev. Các chi tiết cơ bản - ngày, giờ, thời lượng, tín hiệu báo bận, cuộc gọi nhỡ và “sự kiện cuộc gọi chờ” - được truy xuất dễ dàng theo yêu cầu. Mainway đã xử lý chúng. Với chặng đầu tiên được tính toán trước, Graph-in-Memory có thể thực hiện chặng thứ hai và thứ ba nhanh hơn nhiều.

    Để giữ cho đồ thị Tsarnaev luôn sẵn sàng, Mainway cũng phải tính toán trước một đồ thị cho những người khác. Và nếu Mainway có hồ sơ điện thoại của bạn, nó cũng chứa một sơ đồ thô về công việc kinh doanh và đời sống cá nhân của bạn.

    Khi tôi phân tích các tài liệu và phỏng vấn các nguồn vào mùa thu năm 2013, các vấn đề cuối cùng cũng sáng tỏ. NSA đã xây dựng một biểu đồ xã hội trực tiếp, luôn cập nhật về nước Mỹ.

    Hồ sơ điện thoại của chúng ta không được lưu trữ trong kho lạnh. Chúng không nằm yên ở đấy mà không được động chạm gì cả. Chúng được sắp xếp trong một chuỗi liên hệ một chặng. Tất cả các loại bí mật - xã hội, y tế, chính trị, nghề nghiệp - đều được tính toán trước, 24/7. Ledgett nói với tôi rằng anh ấy không có lý do gì để lo lắng vì “các liên kết không được lắp ráp cho đến khi bạn khởi chạy một truy vấn”. Tôi đã thấy một cơ sở dữ liệu được cấu hình sẵn để lập bản đồ cuộc sống của bất kỳ ai chỉ bằng một nút bấm.

    Tôi hiểu rằng dòng suy nghĩ này có thể sẽ bị đưa đi quá xa. Có lẽ tôi cũng vậy. Mỹ không phải là Đông Đức. Khi đã tìm được các mảnh ghép để tạo thành bức tranh hoàn chỉnh, tôi không có lý do gì để tin rằng NSA đã sử dụng một cách sai trái bản đồ thời gian thực về cuộc sống của người dân Mỹ. Luật pháp của Mỹ có một số hạn chế đối với việc sử dụng hồ sơ điện thoại. Theo Ban giám sát Quyền riêng tư và Quyền tự do Dân sự, chỉ có 22 quan chức cấp cao có thẩm quyền ra lệnh xây dựng chuỗi liên hệ từ dữ liệu trong các phân vùng FISA của Mainway.

    Nhưng lịch sử không tử tế với niềm tin rằng hành vi của chính phủ luôn tuân theo các quy tắc hoặc rằng các quy tắc sẽ không bao giờ thay đổi theo những cách nguy hiểm. Các quy tắc có thể bị bỏ qua hoặc viết lại - có kèm theo thông báo hoặc không, có ác ý hoặc không, ở một vài mức độ tại một thời điểm hoặc nhiều hơn một vài mức độ. Chính phủ có thể quyết định một ngày nào đó sẽ xem xét Mainway hoặc một hệ thống tương đương để tìm bằng chứng về tội phạm bạo lực hoặc bất kỳ tội phạm nào hoặc bất kỳ nghi ngờ nào. Trước đây, các chính phủ đã đi theo con đường đó. Richard Nixon đã ra lệnh nghe trộm các kẻ thù chính trị của mình. FBI, sau khi đánh giá Martin Luther King Jr là một “người da đen nguy hiểm và có ảnh hưởng”, đã sử dụng phương pháp giám sát bí mật để ghi lại các quan hệ tình dục bất chính của anh ta. Một nhân sự cấp cao dưới trướng J. Edgar Hoover đã yêu cầu King tự sát hoặc sẽ phơi bày các quan hệ đó.

    Gần đây, các hành vi lạm dụng việc giám sát đã xảy ra nhiều hơn. FBI đã đặt hàng trăm thiết bị theo dõi GPS bất hợp pháp mà không theo lệnh. Cảnh sát New York theo dõi có hệ thống các nhà thờ Hồi giáo. Chính quyền các cấp đã sử dụng quyền lực của bang một cách mạnh mẽ nhất, đôi khi là bất hợp pháp, để giám sát các cộng đồng bị thiệt thòi bởi nghèo đói, chủng tộc, tôn giáo, sắc tộc và tình trạng nhập cư. Với tư cách là một ứng cử viên tổng thống, Donald Trump đã đe dọa rõ ràng rằng sẽ đưa ứng viên đối lập vào tù. Ngay khi nắm quyền, ông khẳng định quyền kiểm soát tuyệt đối với bất kỳ cơ quan chính phủ nào. Ông gây áp lực mạnh mẽ lên Bộ Tư pháp để khởi động các cuộc điều tra tội phạm về những người đã chỉ trích ông.
    NSA.JPG
    Graph-in-Memory không biết gì về những thứ như vậy. Nó không có nhận thức về luật pháp hoặc các chuẩn mực hoặc bản chất của sự lạm dụng. Nó tính toán các chuỗi và tạo sơ đồ về các mối quan hệ ẩn giấu của chúng ta trên một bản đồ rộng lớn, liên tục cập nhật. Nó tuân theo các chỉ dẫn được nhúng trong mã, bất kể các chỉ dẫn đó nội dung như thế nào.

    Theo Wired
     
    Chỉnh sửa cuối: 11/09/20, 04:09 PM
    Mời các bạn tham gia Group WhiteHat để thảo luận và cập nhật tin tức an ninh mạng hàng ngày.
    Lưu ý từ WhiteHat: Kiến thức an ninh mạng để phòng chống, không làm điều xấu. Luật pháp liên quan
Tags: