Áp dụng trí tuệ nhân tạo để phòng, chống rửa tiền

Diễn đàn tài chính tiền tệ - Ngày đăng : 18:06, 20/12/2021

(thitruongtaichinhtiente.vn) - Bài viết tập trung trình bày về việc áp dụng trí tuệ nhân tạo (AI) để phòng, chống rửa tiền.

Tóm tắt: Hoạt động rửa tiền ngày càng tinh vi, với hình thức mới xuyên biên giới khiến công tác phòng, chống tội phạm, chống rửa tiền gặp nhiều khó khăn. Tuy nhiên, trí tuệ nhân tạo (AI – Artificial intelligence) sẽ giúp công tác phòng, chống rửa tiền, ngăn ngừa tội phạm hiệu quả hơn. Bài viết tập trung trình bày về áp dụng AI để phòng, chống rửa tiền.

Artificial intelligence application for anti-money laundering activities

Abstract: Money laundering activities are increasingly sophisticated, cross-border, making the prevention of money laundering crimes more difficult. However, with new technology, especially artificial intelligence (AI - Artificial intelligence), it is expected to help the prevention of money laundering crimes more effectively. The article presents of the application of AI for anti-money laundering activities.

1. Giới thiệu

Rửa tiền về mặt pháp lý được hiểu là “chuyển tiền có được bất hợp pháp thông qua những người hoặc tài khoản hợp pháp để không thể truy tìm nguồn gốc của nó” (Black’s Law Dictionary 2009:1097). Theo ước tính từ Cơ quan Phòng chống Ma túy và Tội phạm Liên Hợp Quốc, đã có khoảng 39,4 nghìn tỷ đồng đến 106,6 nghìn tỷ đồng trong tổng số 2 triệu tỷ đồng GDP toàn cầu năm 2019, bị rửa trái phép trên toàn thế giới. Con số này chiếm 2-5% GDP một năm trên toàn cầu.

Hoạt động rửa tiền thường được sử dụng để tài trợ cho hoạt động tội phạm, bao gồm tham nhũng và hối lộ, khủng bố, buôn bán người, buôn bán ma túy và buôn bán vũ khí bất hợp pháp.

Ảnh hưởng bất lợi của rửa tiền đối với các quốc gia là làm tăng tội phạm và tham nhũng, làm suy yếu hệ thống tài chính, giảm đầu tư chân chính từ nước ngoài vào, nền kinh tế và khu vực tư nhân bị suy yếu, gây tổn hại cải cách kinh tế và tiến trình tư nhân hóa, vì vậy cần nâng cao tính hiệu lực trong phòng chống rửa tiền, thông qua đó nâng cao hiệu quả phòng chống tội phạm và tham nhũng, tăng cường sự ổn định của các tổ chức tài chính và góp phần kích thích phát triển kinh tế.

Hoạt động phòng, chống rửa tiền (AML – anti-money laundering) được thực hiện bởi các tổ chức tài chính như ngân hàng và các tổ chức cấp tín dụng khác, nỗ lực để chống rửa tiền bằng cách xác định các rủi ro rửa tiền, những kẻ rửa tiền tiềm ẩn và các giao dịch rửa tiền. Do những hạn chế nhất định, hệ thống AML hiện tại hoạt động thông qua sự kết hợp giữa chuyên môn của con người và tự động hóa máy móc. Các phương pháp này thường kết hợp chặt chẽ giữa AI hoặc các kỹ thuật khai thác dữ liệu; tuy nhiên, vẫn phụ thuộc nhiều vào các kiểm toán viên. Hệ thống AI của các tổ chức tài chính có xu hướng đơn giản hóa và dựa trên quy tắc, một giao dịch sẽ bị gắn cờ nghi ngờ và yêu cầu được xem xét để xác định liệu có đáp ứng bộ quy tắc cơ quan quản lý đưa ra hay không. Các hệ thống dựa trên quy tắc dẫn đến nhiều giao dịch không thể quản lý bị gắn cờ nghi ngờ nên đòi hỏi phải dành nhiều thời gian và tiền bạc để xem xét các giao dịch hợp pháp (Gallo và Juckes, 2005). Sự ra đời và phát triển của AI giúp nâng cao, tạo điều kiện thuận lợi cho quá trình ra quyết định tổng thể trong khi vẫn tuân thủ các chính sách như Quy định bảo vệ dữ liệu chung (GDPR) mới. AI còn có thể giúp giảm thiểu số lượng các giao dịch được gắn nhãn nghi ngờ giả,  có thể chứng minh việc tuân thủ các kỳ vọng quy định và cải thiện năng suất của các nguồn lực hoạt động.

2. Chính sách Phòng, chống rửa tiền

Lực lượng đặc nhiệm tài chính quốc tế (FATF) được thành lập năm 1989 để phòng chống rửa tiền (AML) và chống tài trợ khủng bố (CTF). Đây là một cơ quan liên chính phủ bao gồm 35 khu vực pháp lý thành viên và hai tổ chức khu vực. FATF yêu cầu tất cả các chương trình phòng, chống rửa tiền và chống tài trợ khủng bố phải bao gồm các báo cáo và phân tích dữ liệu cụ thể; đồng thời yêu cầu các tổ chức phải có khả năng xác định và xác minh khách hàng của họ, thường được gọi là yêu cầu “nhận biết khách hàng của bạn”. Điều này nghiêm cấm các tài khoản ẩn danh và tên chủ tài khoản giả mạo, cũng như yêu cầu các tổ chức thực hiện các biện pháp phòng ngừa khi giao dịch với các ngân hàng đại lý và ngân hàng trung gian. Một yêu cầu khác là ngân hàng phải lưu giữ hồ sơ của tất cả các giao dịch trong thời gian tối thiểu 5 năm. Dữ liệu cần bao gồm tên của khách hàng và /hoặc người thụ hưởng, địa chỉ của họ, bản chất của giao dịch, ngày giao dịch, loại tiền tệ, số lượng tiền tệ, loại tài khoản và số nhận dạng của bất kỳ tài khoản nào đã sử dụng. FATF yêu cầu hai loại báo cáo: báo cáo giao dịch đáng ngờ (STR) được lập với đơn vị tình báo tài chính quốc gia và báo cáo giao dịch tiền tệ (CTR) - báo cáo các giao dịch trên một số tiền nhất định.

2.1. Chính sách dựa trên quy tắc

“40 khuyến nghị về rửa tiền” được phát hành vào năm 1990 như một khung cơ bản để phát hiện, ngăn chặn hành vi tài trợ phạm pháp. Sau vụ tấn công khủng bố ngày 11/9/2001 ở thành phố New York (Mỹ), “9 khuyến nghị đặc biệt về tài trợ cho khủng bố” đã được phát hành để tập trung vào chống tài trợ khủng bố. Các chính sách dựa trên quy tắc như vậy rất rõ ràng và minh bạch, giúp các tổ chức tài chính dễ dàng thực hiện và thể hiện sự tuân thủ. Các hệ thống phòng chống rửa tiền hiện tại sử dụng các quy tắc này trong lớp tự động của mình, để quyết định xem một giao dịch có đáng ngờ hay không. Tuy nhiên, sự rõ ràng của các quy tắc này khiến việc gian lận khó bị phát hiện vì các giao dịch có thể được thiết kế để tránh các quy tắc này. Các quy tắc cũng dẫn đến việc báo cáo quá mức về hành vi đáng ngờ, gây tốn kém và mất thời gian để xử lý.

2.2. Chính sách dựa trên rủi ro

Chính sách dựa trên rủi ro cho phép các tổ chức tư nhân có quyền quyết định hơn về những gì cần báo cáo do có các tiêu chí báo cáo mơ hồ hơn. Điều này đặt quyền quyết định vào tay các doanh nghiệp tư nhân, khiến họ phải chịu trách nhiệm về sự thành công của việc báo cáo. Tuy nhiên, điều đó đã làm cho việc báo cáo quá mức trở nên tồi tệ hơn ở một số quốc gia. Đây là một phương pháp có rủi ro cao hơn, khiến các ngân hàng có thể mất khách hàng hoặc bị phạt vì báo cáo dưới mức bình thường. Tuy nhiên, nhiều tổ chức tài chính đã áp dụng các hệ thống dựa trên rủi ro (Helmy và cộng sự, 2014). Họ khắc phục những hạn chế của các giải pháp dựa trên quy tắc đánh giá rủi ro giao dịch và khách hàng, hoặc bằng cách xác định hành vi ngoại lai.

2.3. Thực thi và kiểm tra

FATF kêu gọi hình sự hóa hoạt động rửa tiền nhưng không phải tất cả các quốc gia đã làm điều này, việc thực thi pháp luật không thể thống nhất giữa các quốc gia. Do đó, các quốc gia khác nhau đã áp dụng một tập hợp con các phương pháp thực thi sau với các mức độ thành công khác nhau: (1) giám sát xuất nhập khẩu giữa các quốc gia; (2) yêu cầu các tổ chức từ thiện cung cấp tài liệu hàng năm, bao gồm các báo cáo tài chính; (3) đưa các quốc gia và những nhà tài trợ khủng bố bị nghi ngờ vào danh sách đen; (4) các biện pháp trừng phạt; (5) án tù, hình phạt và tiền phạt; (6) đòi hỏi sự minh bạch của ngân hàng; (7) các ngân hàng bị phạt nặng vì không điều tra đầy đủ gian lận rửa tiền (Thompson và Perez, 2017).

2.4. Quy định về bảo vệ dữ liệu chung (GDPR)

Gần đây, Liên minh châu Âu (EU) đã thông qua một số quy định quan trọng (được gọi là GDPR) liên quan đến việc thu thập, lưu trữ và sử dụng thông tin cá nhân; đây được coi là luật trên toàn EU có hiệu lực từ tháng 5/2018 và thay thế Chỉ thị bảo vệ dữ liệu năm 1995 (DPD) của EU. Về phạm vi, quy định mới được áp dụng thống nhất cho các ngành, tổ chức EU và các tổ chức xử lý dữ liệu của EU. Các quy định về dữ liệu tập trung vào một số vấn đề cụ thể, bao gồm quyền sở hữu dữ liệu, tính minh bạch, khả năng giải thích và khả năng tin cậy của các thuật toán được đào tạo hoặc xây dựng với dữ liệu đó. Tóm lại, GDPR quy định hệ thống tự động theo hướng dữ liệu - bao gồm cả hệ thống phòng chống rửa tiền - phải điều chỉnh những điều sau đây trong quá trình triển khai: (1) xử lý dữ liệu hợp pháp và quyền sở hữu dữ liệu, (2) khung giải thích cho dữ liệu và thuật toán, và (3) tuân thủ đạo đức.

3. Hệ thống phòng chống rửa tiền tiên tiến Với AI

3.1. Các giai đoạn rửa tiền

Sắp xếp, phân lớp và tích hợp là ba giai đoạn trong kế hoạch rửa tiền. Tiền thu được từ các hoạt động tội phạm bước vào giai đoạn sắp xếp, nơi chúng được chuyển đổi thành công cụ tiền tệ hoặc gửi vào một tổ chức tài chính (hoặc cả hai). Phân lớp đề cập đến việc chuyển tiền cho các tổ chức tài chính hoặc cá nhân khác thông qua chuyển khoản ngân hàng, séc, lệnh chuyển tiền hoặc các phương thức khác. Trong giai đoạn tích hợp, các quỹ được sử dụng để mua các tài sản hợp pháp hoặc để tiếp tục duy trì các doanh nghiệp. Ở đây, tiền thu được bất hợp pháp trở thành một phần của nền kinh tế hợp pháp.

Các phương pháp tiếp cận AI có thể được áp dụng để xác định các hoạt động rửa tiền trong từng giai đoạn rửa tiền trên. Các phương pháp học máy phổ biến như máy vectơ hỗ trợ (SVMs) và rừng ngẫu nhiên (RF) có thể được sử dụng để phân loại các giao dịch gian lận, sử dụng bộ dữ liệu ngân hàng lớn, có chú thích (Tang và Yin 2005). Các phương pháp tiếp cận theo hướng dữ liệu này thường được sử dụng cho các giai đoạn sắp xếp và phân lớp vì dữ liệu giao dịch được ngân hàng giám sát. Giai đoạn tích hợp rất khó phát hiện vì các quỹ đã vượt qua cơ chế phát hiện gian lận. Ở giai đoạn này, các phương pháp AI nâng cao - ví dụ: trích xuất mối quan hệ thực thể từ dữ liệu tin tức và mạng xã hội lớn - có thể được áp dụng để phòng chống rửa tiền.

Khi các giao dịch đáng ngờ đã được xác định bởi các quy tắc hoặc hệ thống dựa trên học máy, một nhà điều tra gian lận sẽ tham gia vào các quy trình phân tích. Khối lượng công việc của một nhân viên điều tra phần lớn phụ thuộc vào số lượng giao dịch gian lận được báo cáo. Các phương pháp tiếp cận xử lý ngôn ngữ tự nhiên (NLP) của phân tích thực thể và mối quan hệ có thể giúp giảm bớt gánh nặng công việc bằng cách cung cấp cho các chuyên gia sự hình dung mối quan hệ liên kết và điểm số dựa trên dữ liệu tin tức (ví dụ: cơ sở dữ liệu tin tức của ngân hàng và các nguồn tin tức truyền thống hoặc mạng xã hội) liên quan đến pháp nhân gian lận tiềm năng.

3.2. Các giải pháp phòng chống rửa tiền

3.2.1. Giải pháp dựa trên quy tắc

Hiện tại, quy trình phòng, chống rửa tiền điển hình là một cấu trúc đường ống tuyến tính kết nối nguồn dữ liệu với một hệ thống dựa trên quy tắc. Các nhà phân tích sau đó kết hợp nghiên cứu của riêng họ để xác định xem các giao dịch là hợp pháp hay gian lận. Một quy trình đa tầng, cụ thể được tuân theo. Đầu tiên, các bộ khung AML thu thập và xử lý dữ liệu. Thứ hai, sàng lọc và giám sát các giao dịch. Nếu một giao dịch được phát hiện là đáng ngờ, giao dịch đó sẽ bị cắm cờ, nhà phân tích sẽ quyết định xem giao dịch đó có gian lận hay không. Nói chung, các bộ khung AML có thể được phân tách thành nhiều lớp. Lớp đầu tiên là lớp dữ liệu - nơi thu thập, quản lý và lưu trữ dữ liệu có liên quan diễn ra, bao gồm cả dữ liệu nội bộ từ tổ chức tài chính và dữ liệu bên ngoài từ các nguồn như cơ quan quản lý, chính quyền và danh sách theo dõi. Lớp thứ hai là lớp sàng lọc và giám sát - sàng lọc các giao dịch và khách hàng để tìm hoạt động đáng ngờ. Lớp này hầu hết đã được các tổ chức tài chính tự động hóa thành một quy trình đa tầng thường dựa trên các quy tắc hoặc phân tích rủi ro. Nếu một hoạt động đáng ngờ được phát hiện, nó sẽ được chuyển đến lớp cảnh báo và sự kiện để kiểm tra thêm. Quá trình này bao gồm việc tăng cường dữ liệu với thông tin giao dịch lịch sử và bằng chứng cần thiết, để xem xét giao dịch đã bị gắn cờ. Việc khai thác mạng xã hội và nội dung web để thu thập thông tin phục vụ điều tra chưa được phát triển trong các hệ thống AML hiện tại. Do đó, các kiểm toán viên bị thiếu nguồn lực, làm tăng tính thiếu chính xác của các quyết định của kiểm toán viên và thời gian cần thiết để kiểm tra từng giao dịch. Quyết định chặn hoặc phê duyệt giao dịch được thực hiện bởi nhà phân tích trong lớp hoạt động.

3.2.2.  Phân tích mạng

Phân tích mạng là một phương pháp khác để xác định các hoạt động rửa tiền, thường đề cập đến các nghiên cứu sử dụng dữ liệu quan hệ để xác định vị trí các kết nối trực tiếp và ẩn với nốt mạng rửa tiền. Một trong những phương pháp phân tích mạng ban đầu là đánh giá tính trung tâm, được sử dụng để xác định nốt mạng nào là quan trọng nhất trong mạng lưới (Bavelas, 1950). Các hệ thống phân tích mạng thông thường chứa các biến sau: độ trung tâm trực tiếp (degree of centrality), tính xác thực (authoritativeness), độ trung tâm trung gian (betweenness centrality), độ gần trung tâm (closeness centrality), trung tâm (hubness), và xếp hạng trang (page rank) (Hanneman and Riddle, 2005). Drezewski và cộng sự (2015) đã áp dụng các thành phần phân tích mạng để xây dựng và phân tích mạng xã hội bằng cách sử dụng sao kê ngân hàng và dữ liệu cho các vụ rửa tiền của National Court Register. Trong quá trình phân tích mạng, họ chỉ định vai trò cho các nút trong mạng, đo lường kết nối của các vai trò, cố gắng xác định mức độ gần nhau của các thực thể và so sánh thông tin này với thông tin về vai trò bên ngoài (ví dụ: sao kê ngân hàng và National Court Register) được chỉ định cho các nút. Colladon và Remondi (2017) đã xây dựng một số mạng để hoạt động chung, bao gồm giao dịch, khu vực kinh tế, khu vực địa lý và mạng liên kết ngầm để ngăn chặn rửa tiền. Họ đã sử dụng dữ liệu thực tế trong 19 tháng của một công ty bao thanh toán chủ yếu hoạt động ở Ý và nhận thấy rằng các chỉ số mạng cực kỳ hữu ích trong việc đánh giá rủi ro gian lận.

3.2.3. Phân tích liên kết

Một cách tiếp cận để xác định rửa tiền là xác định một biểu đồ liên kết trên các thực thể. Mối quan hệ giữa các chủ thể (được biểu thị dưới dạng nút) có thể được xác định bằng các giao dịch kết nối chúng (được biểu thị dưới dạng liên kết). Trong nghiên cứu của Goldberg và cộng sự (1998), liên kết và lý luận dựa trên tình huống được sử dụng để hình dung và phân tích rửa tiền. Những ý tưởng này cũng đã được áp dụng cho hoạt động rửa tiền trên điện thoại di động ở Lopez-Rojas và Axelsson (2012). Họ đã tạo ra các biểu đồ liên kết tổng hợp (tương tự như mạng xã hội), mà họ sử dụng để trực quan hóa và phát hiện các kết nối nhất định. Zhang và cộng sự (2003) đã xem xét một tình huống trong đó không có liên kết rõ ràng nào có thể quan sát được giữa các thực thể trong một biểu đồ liên kết. Họ đã tạo ra các cộng đồng - dựa trên các mối quan hệ chưa được xác định - và sử dụng các mối tương quan làm thuộc tính, để hình thành các liên kết mới. Họ đã sử dụng 7668 tài liệu dạng văn bản tự do (free-text) liên quan đến một vụ rửa tiền có thật, quét tài liệu bằng cách sử dụng nhận dạng ký tự quang học, gắn thẻ các thực thể chính và tạo ra một ngôn ngữ đánh dấu có thể mở rộng chứa các chi tiết như tên của người đó, tổ chức, thời gian giao dịch, địa điểm giao dịch, số lượng… Họ đã thử nghiệm thuật toán tạo liên kết trên dữ liệu này. Phân tích liên kết là một công cụ hữu ích để đại diện cho các kết nối giữa các thực thể (ví dụ: chủ thể, tổ chức, tài khoản ngân hàng).

3.2.4. Phát hiện ngoại lai

Một cách để tạo khung cho AI và các nhiệm vụ khai thác dữ liệu của hoạt động rửa tiền hoặc phát hiện gian lận là thông qua phát hiện ngoại lai. Trong phương pháp này, người ta xác định giao dịch bình thường hoặc giao dịch nội bộ sẽ xuất hiện như thế nào đối với một chủ thể và sau đó phát hiện bất kỳ giao dịch đủ khác thường để được coi là ngoại lai. Nhóm ngang hàng được xác định để nắm bắt thói quen chi tiêu điển hình của khách hàng. Phân nhóm là một phương pháp tiêu chuẩn để xác định các nhóm ngang hàng, tiếp theo, một khoảng cách được tính toán giữa các giao dịch đến và các nhóm ngang hàng để phát hiện các hành vi ngoại lai (Kannan and Somasundaram, 2017). Ví dụ, Le-Khac và cộng sự, (2009) đã sử dụng phân nhóm k-means để phân nhóm dữ liệu, sau đó sử dụng khoảng cách của giao dịch mới từ các cụm để xác định các ngoại lệ, sử dụng thông tin do ngân hàng cung cấp. Larik và Haider (2010) cũng sử dụng phân nhóm để xác định hành vi bình thường. Họ xếp hạng các giao dịch đến theo độ lệch của chúng so với các nhóm, sử dụng khoảng 8,2 triệu giao dịch thực. Liu và cộng sự, (2008) đã tìm thấy các chuỗi giao dịch đáng ngờ, sử dụng lịch sử tài khoản cá nhân và thông tin từ các tài khoản tương tự khác. Họ đã sử dụng dữ liệu do một tổ chức tài chính Trung Quốc cung cấp và tính toán sự tương đồng giữa các giao dịch mới và các giao dịch rủi ro cao, để xếp hạng mức độ nghi ngờ.

3.2.5. Phân loại / chấm điểm rủi ro

Nhiều bài báo học thuật trình bày lớp sàng lọc và giám sát như một lớp xác định xem một giao dịch có đáng ngờ hay không. Do thiếu dữ liệu thực, nhiều nhóm đã làm việc với các tập dữ liệu mô phỏng. Hơn nữa, vì các tổ chức tài chính hiếm khi được thông báo nếu một giao dịch được xác định là rửa tiền (quyết định do chính phủ đưa ra), nên các phương pháp hiện thường sử dụng dữ liệu gian lận tổng hợp. Ví dụ, Tang và Yin (2005) đã đào tạo một SVM để dự đoán các giao dịch đáng ngờ từ dữ liệu ngân hàng thực, bộ dữ liệu mà họ đã thêm vào bộ dữ liệu tổng hợp về các giao dịch bị nghi ngờ gian lận. Lopez-Rojas và Axelsson (2012) đã thử nghiệm một số kỹ thuật phân loại - bao gồm rừng ngẫu nhiên (random forest), cây quyết định (decision trees), naive Bayes và bảng quyết định - để dự đoán rửa tiền trong các ứng dụng di động. Họ sử dụng ID khách hàng, số tiền, ngày giao dịch, loại giao dịch, số tiền đã chuyển, vị trí và tuổi của khách hàng để đại diện cho mỗi giao dịch. Họ đã tạo ra 486.977 giao dịch tổng hợp, 6.006 trong số đó được dán nhãn đáng ngờ. Họ nhận thấy rằng cây quyết định đạt được hiệu suất cao nhất. Một cây quyết định là đại diện của một hệ thống dựa trên quy tắc phân loại các giao dịch là gian lận nếu chúng vượt quá các ngưỡng nhất định. Các phương pháp học máy và khai thác dữ liệu đã được áp dụng để phân biệt các giao dịch gian lận và dự đoán liệu các giao dịch mới có gian lận hay không. Kingdon (2004) đã dự đoán các yếu tố ngoại lai bằng cách đào tạo SVM để xác định mức độ không phù hợp, dựa trên các đặc điểm đại diện cho các hoạt động của người dùng. Quá trình này rất giống với các phương pháp phát hiện ngoại lai đã thảo luận ở trên, tuy nhiên, khác ở chỗ nó đào tạo một mô hình để dự đoán sự bất thường thay vì khớp các giao dịch với các trường hợp trước đó bằng cách sử dụng phân nhóm.

3.2.6. Học đồ thị

Một nút có thể đại diện cho một tài khoản đơn trong dữ liệu đồ thị giao dịch đồ sộ. Trong khi đó, các tổ chức tài chính xử lý hàng triệu giao dịch mỗi giây. Những thách thức chính trong học đồ thị cho AML là tốc độ học/phân tích cú pháp đồ thị và kích thước đồ thị. Một công trình sơ bộ của Weber và cộng sự (2018) tập trung vào kỹ thuật học đồ thị nhanh hơn cho AML. Học đồ thị nhanh sử dụng Mạng chuyển đổi đồ thị nhanh (Fast - Graph Convolutional Networks - fast GCN), làm tăng đáng kể tốc độ đào tạo so với GCN thông thường.

3.3. Những thách thức của các giải pháp AML hiện tại

Thứ nhất, thống nhất được định nghĩa hoạt động rửa tiền là một vấn đề đối với các nhà hoạch định chính sách và đối với các thiết kế hệ thống AML. Do không có một khung duy nhất nào xác định được hành vi gian lận nên việc rửa tiền có thể dễ bị nhầm lẫn với các giao dịch hợp pháp. Các hình thức gian lận liên tục thay đổi, khiến các hệ thống và chính sách dựa trên quy tắc khó theo kịp. Những khó khăn này khiến các tổ chức phải lựa chọn giữa hiệu quả và hiệu suất của hệ thống AML của mình. Một hệ thống có hiệu suất cao nhanh chóng xác định gian lận ít dựa vào con người và có nguy cơ bỏ qua các giao dịch gian lận cao. Hệ thống có rủi ro thấp hơn sẽ an toàn hơn vì phần lớn các giao dịch sẽ được sàng lọc chuyên sâu; tuy nhiên, điều này gây tốn kém cho cả các nhà phân tích và tổ chức tài chính. Sự đánh đổi giữa rủi ro và chi phí phải được các tổ chức cá nhân xem xét khi họ thiết kế hệ thống của mình.

Thứ hai, AML tự động đã bị hạn chế bởi quyền truy cập dữ liệu và các vấn đề kỹ thuật. Điều quan trọng là các hệ thống phải được đào tạo bằng cách sử dụng dữ liệu thực, thay vì dữ liệu mô phỏng. Hiện tại, không có dữ liệu nguồn mở nào cho nghiên cứu rửa tiền, do tầm quan trọng của việc duy trì quyền riêng tư của khách hàng. Do đó, dữ liệu cần được cung cấp bởi các tổ chức tư nhân; đây là một nhiệm vụ khó vì việc trích xuất dữ liệu khách hàng có thể ảnh hưởng đến danh tiếng của một tổ chức và có thể không tuân thủ quản trị quyền riêng tư dữ liệu. Các tổ chức đấu tranh để xử lý dữ liệu của họ trong nội bộ do số lượng lớn dữ liệu họ thu thập, phần lớn trong số đó là nhiễu.

Thứ ba, một trong những vấn đề quan trọng nhất mà các tổ chức tài chính phải vượt qua khi thực hiện AML là việc phân phối, lưu trữ và xử lý dữ liệu của mình. Trong hầu hết các tổ chức, bất kỳ giao dịch nào được các nhà phân tích cho là gian lận sẽ được gửi đến các cơ quan có thẩm quyền để đánh giá thêm. Quyết định cuối cùng về việc liệu một giao dịch có thực sự là gian lận hay không không nhất thiết phải được báo cáo cho tổ chức tài chính. Do đó, các tổ chức tài chính thu được một số lượng lớn các giao dịch đáng ngờ mà các nhà phân tích của họ cho là gian lận, nhưng không có phản hồi về tính chính xác của các quyết định này từ các cơ quan có thẩm quyền. Điều này có nghĩa là dữ liệu mà các tổ chức tài chính có thể cung cấp cho các nhà nghiên cứu là nhiễu và thường không có nhãn “gian lận” hoặc “hợp pháp”; khiến cho việc xây dựng các mô hình dự đoán các giao dịch gian lận trở nên khó khăn. Nó cũng làm cho việc đánh giá độ chính xác của các phương pháp hiện có thông qua việc so sánh với nhau cũng trở nên khó khăn hơn. Nếu không có lớp phủ định đúng và khẳng định đúng, không thể xác định liệu một phương pháp có hoạt động hiệu quả hay vượt trội hơn các nhà phân tích và các phương pháp khác hay không. Có nghĩa là khi thiết kế các giải pháp AI cho AML, điều quan trọng là phải tham khảo ý kiến của các nhà phân tích, vì phản hồi của họ có thể đại diện cho nguồn có sẵn duy nhất để hiểu hoạt động của hệ thống.

Thứ tư, đảm bảo tính bảo mật và quyền sở hữu dữ liệu cũng là một thách thức. Các ứng dụng học máy sử dụng nguồn dữ liệu công khai và các chuỗi dữ liệu thực. Dữ liệu liên quan được yêu cầu liên tục để nâng cao hiệu suất của hệ thống AML. Tuy nhiên, các tổ chức tài chính luôn thận trọng về dữ liệu của họ. Do đó, số lượng dữ liệu mở trong AML bị giới hạn. Một vấn đề quan trọng khác là thiếu nguồn dữ liệu dùng chung; ngoại trừ danh sách theo dõi và một số khuyến nghị quy định đáng tin cậy, các tổ chức trên khắp thế giới không duy trì một nhóm dữ liệu dùng chung có thể được sử dụng cho lợi ích của nghiên cứu AML. Trong những tình huống như vậy, sự phức tạp của việc thực hiện các quy định về quyền sở hữu và quyền riêng tư dữ liệu của GDPR có thể làm giảm tiến độ của nghiên cứu AML. Phân tích liên kết, phân tích quan điểm, nhiều kỹ thuật dựa trên kiến thức và lập trình ngôn ngữ tư duy (NLP) khác thường được sử dụng để giảm tỷ lệ dương tính giả cao trong AML. Việc triển khai các thành phần như vậy phụ thuộc rất nhiều vào dữ liệu công khai. Việc thực hiện các chính sách về quyền riêng tư và quyền sở hữu dữ liệu có thể làm giảm số lượng tài nguyên có sẵn để sử dụng. Hơn nữa, về mặt giải thích các quá trình ra quyết định, cần hết sức thận trọng nếu phần giải thích được tạo ra từ nguồn dữ liệu tư. Khả năng tiết lộ thông tin quan trọng là hiện hữu. Các chính sách GDPR nhất định còn yêu cầu “đánh giá tác động bảo vệ dữ liệu” được các tổ chức xử lý dữ liệu cá nhân thông qua để xác định và giảm thiểu rủi ro về bảo vệ dữ liệu. Điều này có thể là một thách thức khi quản lý các tập dữ liệu lớn, do sự phức tạp và việc sử dụng dữ liệu cá nhân không mong muốn.

Thứ năm, tính hiệu quả của các hệ thống hiện đại bị hạn chế phần nào bởi khả năng giải thích một quyết định cụ thể đã được đưa ra/dự đoán. Gần đây đã có nghiên cứu khả năng giải thích của các thuật toán tuy nhiên, bản chất của các giải thích thay đổi tùy theo sự khác nhau trong dữ liệu và thuật toán, và không có khuôn khổ giải thích chung hoặc tiêu chuẩn nào được thực hiện. Ví dụ: khi vận hành mạng nơ ron hình ảnh và mạng phức hợp (Kumar và cộng sự, 2017), các giải thích cho một dự đoán có thể được trình bày dưới dạng các đặc điểm cấp thấp (ví dụ: cạnh, đường cong) và cấp cao (ví dụ: mẫu) thu được trong quá trình học. Việc diễn giải dự đoán tương đối dễ dàng đối với một số mô hình (ví dụ: tuyến tính) và khó đối với những mô hình khác [ví dụ: mô hình học sâu (deep – learning) như bộ nhớ dài-ngắn (long short-term memory - LSTM)]. Một sự đánh đổi luôn tồn tại giữa bản chất giải thích và độ phức tạp của mô hình.

Thứ sáu, các giải thích về phạm vi vĩ mô (tức là giải thích tổng thể cho một quyết định) và vi mô (tức là giải thích về các thành phần học máy trong đường ống) và tích hợp của chúng là một thách thức kiến trúc khác đối với các giải pháp AML dựa trên tác tử. Mặc dù có thể dễ dàng xây dựng các khung cho các hệ thống dựa trên quy tắc, nhưng chúng cũng đặt ra một số thách thức. Ví dụ: các giải thích về các quy tắc phức tạp để giám sát giao dịch tùy thuộc vào các quy định về tính nhạy cảm và quyền riêng tư của dữ liệu. Một khung giải thích cho dữ liệu cũng cần thiết. Các mô tả pháp lý và chức năng của dữ liệu phải minh bạch và rõ ràng, dễ hiểu. Các mô tả pháp lý đề cập đến nguồn và quyền sở hữu dữ liệu và các mô tả chức năng đề cập đến các đặc tính của dữ liệu (ví dụ: liệu dữ liệu có chứa bất kỳ thuộc tính phân biệt đối xử nào hay đại diện quá mức và /hoặc thiếu của một nhóm nhất định theo cách có thể gây hại cho các quyết định trong thế giới thực hay không). Học máy - đặc biệt là học máy có giám sát - hoàn toàn phụ thuộc vào dữ liệu và một mô hình có thể tạo ra sự không nhất quán/sai lệch có trong dữ liệu. Một khung về giải thích dữ liệu đáp ứng với tính bảo mật, khả năng tương thích và độ lệch có thể đóng một vai trò quan trọng.

Thứ bảy, một số chính sách có thể dễ dàng chuyển thành yêu cầu kỹ thuật và một số thì không. Các giải thích về chính sách có thể được thực hiện trong các giai đoạn khác nhau của hệ thống. Tuy nhiên, khi các chủ đề (ví dụ: “AI có trách nhiệm”-  responsible AI) được thảo luận, vẫn chưa rõ cách thức và vị trí các chính sách đó sẽ được kết hợp trong một mô hình /giải pháp.

Tóm lại, thời kỳ 4.0, công nghệ chính là giải pháp, là công cụ để cải thiện quy trình phòng, chống rửa tiền. Một số tổ chức tài chính bắt đầu bước vào thế giới mới của AI và nhận ra rằng, các hệ thống dựa trên quy tắc có từ hàng thập kỷ qua không thể  theo kịp các mối đe dọa tinh vi. Vì vậy việc vận hành công nghệ AI tiên tiến và khiến nó hoạt động song song với các hệ thống dựa trên quy tắc là một giải pháp thiết thực để ngày càng nâng cao chất lượng, hiệu quả của hoạt động phòng, chống rửa tiền.

Tài liệu tham khảo

- Bavelas, A. (1950). Communication patterns in task-oriented groups. The Journal of the Acoustical Soci-ety of America, 22(6), 725–730.

- Colladon, A. F., & Remondi, E. (2017). Using social network analysis to prevent money laundering. Expert Systems with Applications, 67, 49–58. https ://doi.org/10.1016/j.eswa.2016.09.029.

- Drezewski, R., Sepielak, J., & Filipkowski, W. (2015). The application of social network analysis algo-rithms in a system supporting money laundering detection. Information Scienece, 295, 18–32.

- Gallo, P. A., & Juckes, C. C. (2005). Threshold transaction disclosures: access on demand through latent disclosure rather than reporting. Journal of Money Laundering Control, 8, 328–334

- Goldberg, H.G., & Wong, R.W.H. (1998). Restructuring transactional data for link analysis in the Fin-CEN AI System. AAAI Technical Report, FS-98-01, 38–46

- Hanneman, R.A, & Riddle, M. (2005). Introduction to social network methods. Riverside, CA: Uni-versity of California, Riverside.

- Helmy, T. H. E., Abd-ElMegied, M. Z., Sobh, T. S., & Badran, K. M. S. (2014). Design of a monitor for detecting money laundering and terrorist financing. International Journal of Computer Net-works and Applications, 1(1), 15–25

- Kannan, S., & Somasundaram, K. (2017). Autoregressive-based outlier algorithm to detect money laundering activities. Journal of Money Laundering Control, 20(2), 190–202.

- Kingdon, J. (2004). AI fights money laundering. IEEE Intelligent Systems, 19, 87–89

- Kumar, D., Wong, A., & Taylor, G.W. (2017). Explaining the unexplained: a class-enhanced atten-tive response (CLEAR) approach to understanding deep neural networks. https ://arxiv .org/abs/1704.04133.

- Larik, A. S., & Haider, S. (2010). Clustering based anomalous transaction reporting. Procedia Computer Science, 3, 606–610

- Le-Khac, N.-A., Markos, S., Kechadi, M.-T. (2009). Towards a new data mining-based approach for anti-money laundering in an international investment bank. In International Conference on Digital Forensics and Cyber Crime.

- Lopez-Rojas, E.A., & Axelsson, S. (2012). Money laundering detection using synthetic data. Proceed-ings of the 27th Annual Workshop of the Swedish Artificial Intelligence Society (SAIS), Örebro, Swe-den, 14–15 May 2012, 33–40

- Liu, X., Zhang, P., & Zeng, D. (2008). Sequence matching for suspicious activity detection in anti-money laundering. In Intelligence and Security Informatics Workshops.

- Tang, J., & Yin, J. (2005). Developing an intelligent data discriminating system of anti-money laundering based on SVM. Proceedings of the 2005 International Conference on Machine Learning and Cyber-netics, Guangzhou, China, 18–21 Aug. 2005, 3453–3457.

- Thompson, M., & Perez, E. (2017). BNP Paribas to Pay Nearly $9 Billion Penalty. CNN Business. Retrieved from https ://money.cnn.com/2014/06/30/inves ting/bnp-parib as-sanct ions-fine/.

- Weber, M., Chen, J., Suzumura, T., Pareja, A., Ma, T., Kanezashi, H., Kaler, T., Leiserson, C.E., & Schardl, T.B. (2018). Scalable graph learning for anti-money laundering: a first look. arXiv:1812.00076

- Zhang, Z., Yu, P.S., & Salerno, J.J. (2003). Applying data mining in investigating money laundering crimes. Proceedings of the ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 24–27, 2003, 747–752

Bài đăng trên Tạp chí Thị trường Tài chính Tiền tệ số 8/2021

ThS. Nguyễn Đoàn Châu Trinh