Chỉ nhắc riêng đến việc nhận biết hình dạng và hình ảnh trên các bề mặt 2 chiều (phẳng) đã đủ phức tạp cho các máy tính. Khi nói đến nhận dạng vật thể 3 chiều, mọi thứ trở nên khó khăn hơn bởi hình dạng của một vật thể thay đổi hẳn ở các góc, khoảng cách và điều kiện ánh sáng khác nhau-chỉ cần nghĩ về hình chiếu bên hông một tờ giấy so với hình chiếu của tờ giấy đó nhìn trực diện từ trên xuống, hoặc hình ảnh khác biệt của một rừng cây khi đang trổ bông hay đã rụng sạch lá.
Các phòng thí nghiệm như Trung tâm công nghệ hình ảnh Úc tại Đại học Adelaide đang nghiên cứu việc nhận dạng và hiển thị trực quan tiên tiến các vật thể 3D đối với các ứng dụng như quét 3D, thực tế ảo tăng cường (AR), robot và xe tự hành, nhờ sự giúp đỡ của các bộ tăng tốc xử lý đồ họa NVIDIA Tesla GPU. Các bộ xử lý đồ họa (GPU) xử lý các đơn đặt hàng có khối lượng dữ liệu lớn – nhanh hơn các bộ xử lý trung tâm (CPU), và cung cấp “mã lực” điện toán để chạy các mô phỏng phức tạp nhanh hơn so với trước đây.
Đại học Adelaide, một trong những trường đại học nghiên cứu hàng đầu của Úc, đang khai thác công nghệ máy học (machine learning), trí tuệ nhân tạo (AI) và các kỹ thuật như cấu trúc từ chuyển động – Structure from Motion (SfM) để đảm bảo rằng hệ thống thông minh như robot hoặc xe ô tô tự lái có thể phân tích chính xác khung cảnh trước mặt chúng. Nếu không có khả năng này, chiếc xe hơi sẽ không thể phân biệt các loại xe và người đi bộ hoặc để xác định con đường kết thúc và lề đường bắt đầu từ đâu.
Ravi Garg, nhà nghiên cứu cao cấp, Trung tâm công nghệ trực quan Úc, đại học Adelaide, giải thích rằng các khung cảnh có thể được phân nhỏ thành các dạng hình học mà sau đó có thể được xác định là vật thể cho dù chúng xoay theo góc nào đi nữa. Một khi các thuộc tính như kích thước, tốc độ và hướng của chuyển động được gán cho một đối tượng, các hệ thống thông minh như một robot hoặc một chiếc xe hơi khi đó có thể phản ứng một cách thích hợp. Thậm chí những hệ thống như vậy sẽ có thể tái tạo lại các đối tượng 3D từ các góc nhìn hạn chế của một khung cảnh.
“Nền tảng nghiên cứu của tôi là chủ yếu liên quan đến cơ cấu từ chuyển động mà chúng ta thấy hình ảnh từ góc nhìn,” Garg nói. “Những gì chúng tôi muốn làm là hiểu hình học của một khung cảnh. Những gì chúng tôi đang làm bây giờ là không chỉ để sử dụng máy học và AI như là công cụ để cung cấp đầu vào, đầu ra, và phát triển các ánh xạ, mà còn để xem xét làm thế nào có thể chúng ta có thể đạt được các kết quả nhất quán trong những tình huống mới và tạo ra sự thấu hiểu sâu sắc đối với công nghệ máy học.”
Garg làm việc với giáo sư Ian Reid trong dự án học bổng ngắn hạn dành cho học giả mang tên “Hệ thống tầm nhìn máy tính suốt đời”. Dự án nhằm mục đích phát triển hệ thống tầm nhìn máy tính mạnh mẽ có thể hoạt động trên một diện tích rộng và qua thời gian dài, khi môi trường thay đổi theo thời gian.
Mục tiêu cuối cùng, theo Garg, là để tạo ra các hệ thống tự học mà có thể thu thập và phân tích khung cảnh tự động. “Tại Đại học Adelaide chúng tôi nghiên cứu các hệ thống học không có giám sát mà có thể áp dụng với ngành y tế, nơi phụ thuộc nặng nề vào các chuyên gia khi cần ra quyết định. Thay vì yêu cầu một chuyên gia để chẩn đoán hàng triệu điểm dữ liệu chúng tôi có thể cung cấp sàng lọc ban đầu tập hợp lớn dữ liệu y khoa. Chúng tôi có thể có những hệ thống mà có thể giúp bác sĩ phân loại các khối u hoặc thậm chí hỗ trợ trong phẫu thuật xâm lấn”Garg nói.
Nghiên cứu của Garg được hiện thực hóa mã lực đỉnh cao của siêu máy tính của đại học Phoenix, mà đã bắt đầu vận hành vào năm 2016. Siêu máy tính này dựa trên công nghệ của Lenovo và được tăng sức mạnh nhờ bộ tăng tốc xử lý đồ họa NVIDIA Tesla GPU để xử lý các tải điện toán hiệu năng cao (HPC). Phoenix đã cắt giảm thời gian chờ đợi tài nguyên HPC tại Đại học Adelaide và tạo điều kiện để có kết quả nghiên cứu nhanh hơn.