Khi làm với với DL, chúng ta làm việc nhiều với các tập dữ liệu, cấu trúc dữ liệu dựa trên cơ sở của hình học tuyến tính với không gian Euclid n chiều. Một tính chất quan trọng của không gian Euclid là “tính phẳng”. Trong hình học còn có các không gian khác được gọi là không gian phi Euclid. Mặt cầu là không gian phi Euclide; một tam giác trên mặt cầu có tổng các góc trong là lớn hơn 180 độ. Thông thường các không gian này được xây dựng bằng cách là biến dạng không gian Euclid.
● Dữ liệu Euclid
Trong Computer Vision hoặc Image Processing, chúng ta quan tâm đến việc phân tích các chức năng được xác định trên một miền phẳng, có nghĩa là có một khái niệm rõ ràng về việc sử dụng các vectơ đơn giản để biểu thị vị trí. Điều này bao gồm các kiểu dữ liệu trong miền 1 chiều và 2 chiều. Nhưng chúng ta không tồn tại trong một thế giới 1D hoặc 2D. Tất cả những gì chúng ta có thể quan sát tồn tại trong 3D và dữ liệu của chúng ta sẽ phản ánh điều đó. Hình ảnh, văn bản, âm thanh đều là dữ liệu Euclid. Phần lớn các tác vụ trong Deep Learning được thực hiện trên dữ liệu Euclid.
● Dữ liệu phi Euclid
Đồ thị và các đối tượng 3D là các tập dữ liệu phi Euclid. Chúng ta có thể coi các mạng xã hội là biểu đồ, trong đó mỗi người dùng là một nút và tương tác của họ với người dùng khác là các cạnh. Mạng cảm biến và mạng máy tính cũng có thể được mô hình hóa dưới dạng biểu đồ trong đó mỗi tín hiệu và giao tiếp đại diện cho các đỉnh trong biểu đồ. Rõ ràng khó có thể tưởng tượng một mạng xã hội mô hình hóa theo cấu trúc phẳng, nhưng nếu bạn nghĩ nó là một biểu đồ, thì một biểu đồ rời rạc có thể được hiểu là một tập hợp mẫu của các bề mặt phẳng. Điều này đề cập đến một tập hợp các điểm dữ liệu không khớp với không gian 2 chiều (ví dụ: đa tạp hoặc đồ thị hình cầu trong đó bạn có nhiều hơn hai trục tọa độ và sau đó bạn cần nhiều hơn hai giá trị phối hợp để chỉ định vị trí của từng điểm dữ liệu trên trục tọa độ).
Vấn đề với loại dữ liệu này là mạng neuron truyền thống không thể phân tích chính xác. Lý do là tích chập hoạt động tốt trên dữ liệu Euclid. Thông thường các CNN (Mạng neuron chuyển đổi) xử lý các tập dữ liệu đó. Việc phân tích (hồi quy / phân loại / phát hiện, v.v.) được thực hiện trên một bề mặt cong.
Sự phát triển của các thiết bị phần cứng đã trợ lực cho Deep Learning và dữ liệu phi Euclid. Trong những năm gần đây, phần cứng chuyên dụng đã được sử dụng để chụp các đám mây điểm với hình ảnh 3D thay vì hình ảnh 2D. Nhiều ứng dụng trong thế giới thực có thể được mô hình hóa dưới dạng biểu đồ (graph) và có rất nhiều dữ liệu qua internet đã hoạt động như một biểu đồ.