Thuật ngữ “big data” (dữ liệu khổng lồ) không còn xa lạ đối với chúng ta. Với hàng tỷ gigabyte thông tin (gọi là exabyte) chảy qua trên hệ thống của mình, các công ty cạnh tranh với nhau để khẳng định rằng họ là người có bộ dữ liệu lớn nhất, táo bạo nhất. Và tất cả các loại hình doanh nghiệp – từ cũ đến mới, công nghiệp và kỹ thuật số, lớn và nhỏ – đều đang gia nhập vào cuộc chơi.
Hàng loại các thông tin về xã hội, thời tiết, và chính phủ xã hội đang được tận dụng để dự đoán sự gián đoạn của chuỗi cung ứng. một lượng lớn dữ liệu người dùng đang được khai thác ở quy mô lớn để xác định các cá nhân trong một biển website được click. Và các công ty thậm chí còn bắt đầu tận dụng số lượng lớn các tin nhắn trao đổi để xây dựng các thuật toán có khả năng trò chuyện với khách hàng.
Nhưng sự thật chính là việc chúng ta không ngừng tập trung vào tầm quan trọng của dữ liệu khổng lồ thường gây hiểu lầm. Vâng, trong một số trường hợp, việc tạo ra giá trị từ dữ liệu có được đòi hỏi phải có một số lượng khổng lồ của dữ liệu đó. Nhưng điều cốt yếu đối với các nhà sáng tạo trong các ngành khác nhau đó là quy mô của dữ liệu không phải là yếu tố quan trọng nhất, mà đó chính dữ liệu phù hợp.
Không phải là vấn đề (dữ liệu) lớn hay nhỏ
Uber thường được nhắc đến như là một câu chuyện thành công về dữ liệu khổng lồ. Không còn nghi ngờ gì nữa, Uber nắm giữ một nguồn thông tin hết sức dồi dào. Bằng cách sử dụng các ứng dụng đang chạy cho cả tài xế và người dùng, Uber đã lập được bản đồ các dòng logistics vận chuyển con người theo thời gian thực (real time).
Nhưng thành công của Uber không phải là chức năng của dữ liệu khổng lồ mà nó thu thập được đem lại. Dữ liệu khổng lồ này đã cho phép công ty gia nhập vào các thị trường mới và thực hiện các công việc mới trong cuộc sống của khách hàng. Thành công của Uber đến từ một thứ rất khác: đó là các dữ liệu nhỏ, nhưng phù hợp mà công ty cần đến để làm một việc rất đơn giản – phân chia xe.
Trong một thời đại trở về trước, khi chúng ta có thể gọi một chiếc xe với một nút bấm trên điện thoại thông minh của mình, lúc đó ta gọi một thứ được gọi taxi. Những chiếc taxi, lúc đó phần lớn chưa được kết nối vào mạng Internet hoặc bất kỳ hình thức cơ sở hạ tầng máy tính chính thức nào, thực sự là những đối tượng mang đến dữ liệu khổng lồ trong việc xác định thông tin người cần đi xe. Tại sao? Hệ thống xe taxi cần một mạng lưới các nhãn cầu (eyeball) di chuyển xung quanh thành phố, quét tìm những dữ liệu hình người với cánh tay dang ra (gọi taxi). Mặc dù không cần sử dụng cơ sở hạ tầng của Intel hay Hewlett-Packard để tích trữ các dữ liệu đó, số lượng thông tin được xử lý để hoàn thành công việc là vô cùng lớn. Thực tế là hoạt động tính toán xảy ra bên trong bộ não con người không thay đổi số lượng của dữ liệu được nắm bắt và phân tích.
Giải pháp thông minh mà đơn giản của Uber đó là dừng việc chạy một thuật toán phát hiện bất thường sinh học trên dữ liệu hình ảnh – mà chỉ cần có được dữ liệu phù hợp để hoàn thành công việc. Ai trong thành phố cần một chuyến đi và họ đang ở đâu? Đó là thành phần quan trọng của thông tin để những công ty như Uber, Lyft, và Didi Chuxing cách mạng hóa ngành này.
Tiếp cận dữ liệu phù hợp để hoàn thành công việc
Đôi khi dữ liệu phù hợp (right data) là một kho khổng lồ nhưng đôi khi dữ liệu phù hợp chỉ là một lượng nhỏ. Đối với các nhà cải cách điều cốt yếu chính là tìm ra phần nào của dữ liệu có thể thúc đẩy vị thế cạnh tranh của doanh nghiệp. Đó sẽ là những dữ liệu phù hợp mà chúng nên thiết tha tìm kiếm. Để đạt được điều đó, trong quá trình tìm kiếm dữ liệu phù hợp, bạn hãy hỏi ba câu hỏi sau đây:
Câu hỏi 1: Những quyết định nào gây ra lãng phí trong doanh nghiệp của bạn?
Hầu hết các doanh nghiệp có rất nhiều yếu tố gây ra lãng phí. Xét trong ngành bán lẻ hoa tươi chẳng hạn. Các cửa hàng hoa bán lẻ duy trì tỉ lệ hư hỏng trung bình có thể lên đến hơn 50% tồn kho của họ. Nghĩa là hơn một nửa số hoa của họ chỉ đơn giản sẽ trở thành đồ bỏ đi. Vì vậy, đối với các công ty sáng tạo như UrbanStems và Bouqs, dữ liệu khiến cho doanh nghiệp của họ có thể đột phá chính là dữ liệu cho phép họ loại bỏ tỉ lệ hư hỏng đó.
Theo như lời của Ben Edelman ở Harvard Business School thì chính sự “hao phí làm nên cơ hội”. Cho dù là trong ngành sản xuất công nghiệp, bán lẻ, hay điều tra pháp lý, công cuộc tìm ra nguyên nhân gây lãng phí công sức và nguồn lực của bạn sẽ hướng bạn đến dữ liệu phù hợp. Cho dù chỉ đơn giản là xác định những dự đoán mà bạn biết bạn đang làm (chẳng hạn như phải dự trữ bao nhiêu hàng tồn kho) hay là bạn đòi hỏi phải suy nghĩ về những quyết định tiềm ẩn trong mô hình kinh doanh của bạn (một chiếc taxi chạy vòng quanh thành phố lúc 10:00 như thế nào), việc phát họa các quyết định sẽ chỉ cho bạn tìm ra nguyên nhân gây lãng phí.
Câu hỏi 2: Những quyết định nào bạn có thể tự động hóa để giảm lãng phí?
Một khi bạn đã ra quyết định, các giả thuyết trở thành những gì bạn thực sự có thể thay đổi. Con người đôi khi thật tuyệt vời lúc họ đưa ra một số quyết định. Khi nói đến việc quyết định chiến dịch nào sẽ kích thích những phản ứng cảm tính nhất của người tiêu dùng đối với các ấn phẩm thương hiệu và marketing, con người có thể cực kỳ sáng dạ. Các loại quyết định như thế này nên nằm trong tay của con người (cho đến bây giờ).
Nhưng khi nói đến việc đưa ra các quyết định đơn giản, lặp đi lặp lại, mang tính vận hành (như điều một chiếc taxi đến địa điểm nào, làm thế nào để định giá sản phẩm, hoặc đặt hàng bao nhiêu hoa với một cửa hàng hoa), máy móc có xu hướng làm tốt hơn nhiều so với con người. Và mặc dù có nhiều mô hình kinh doanh ở thế kỷ 20 đã dựa vào sự kiểm soát của con người để đưa ra những quyết định này, nhưng đến hôm nay, chúng ta có thể xác định dữ liệu cần thiết để tự động hóa những quyết định như thế này nhiều hơn bạn nghĩ.
Một ví dụ điển hình đó là Amazon. Người ta đồn rằng công ty này đã loại bỏ gần như tất cả đội ngũ định giá của mình, hầu hết các quyết định về giá được đưa về dưới sự kiểm soát của thuật toán. Đối với hầu hết các nhà bán lẻ, đây có lẽ là điều hồ đồ. Nhưng nếu thuật toán của Amazon chứng minh hiệu quả, điều này có nghĩa là họ sẽ tốn ít hơn rất nhiều cho hoạt động giảm giá, ít hàng tồn kho chất đống trong kho, và khả năng dự báo tốt hơn về việc giới thiệu sản phẩm mới – mỗi thứ trong số đó đều sẽ mang lại lợi thế cạnh tranh rất lớn cho Amazon.
Câu hỏi 3: Bạn sẽ cần dữ liệu nào để làm điều đó?
Một khi bạn đã có sự hiểu biết về sự lãng phí trong hệ thống kinh doanh của mình và bạn đã phác họa ra các quyết định dẫn đến sự lãng phí đó, bước cuối cùng là hãy hỏi mình một câu hỏi đơn giản. Nếu bạn có thể có bất kỳ loại thông tin nào để đưa ra một quyết định hoàn hảo, đó sẽ là thông tin gì?
Trong trường hợp của Uber, công ty này cần biết chính xác vị trí của tất cả các tài xế tiềm năng trong thành phố để tự động hóa các quyết định xung quanh việc sẽ điều tài xế đi đến địa điểm nào và giảm lãng phí liên quan đến việc tìm kiếm tài xế cho chuyến tiếp theo. Trong trường hợp của phần mềm Predix Industrial Internet của General Electric, công ty mong muốn được biết chính xác khi nào một cái máy sẽ bị hỏng, để giúp tự động hóa các quyết định về những chuyến bảo trì và giảm lãng phí do thời gian chết vì không có kế hoạch trước. Đối với công ty bảo hiểm đang tìm cách cắt giảm chi phí, họ sẽ rất muốn biết thời điểm mà lượng đường trong máu một bệnh nhân tiểu đường của xuống thấp một cách nguy hiểm, giúp tự động hóa các quyết định xung quanh việc can thiệp bệnh nhân và giảm thiểu lãng phí xung quanh việc quản lý bệnh kém.
Đó là những mẫu dữ liệu phù hợp mà bạn cần tìm kiếm. Nếu bạn tiếp cận với những dữ liệu này bằng cách ngấu nghiến một lượng thông tin khổng lồ, điều đó có thể tuyệt vời. Nhưng nếu bạn tiếp cận chúng bằng cách xây dựng một ứng dụng mới để “cảm nhận” chúng một cách trực tiếp, điều này thậm chí còn tốt hơn.
Hầu hết các công ty chi tiêu quá nhiều thời gian cho một kho khổng lồ các dữ liệu, và gần như không đủ thời gian để suy nghĩ về việc phải tìm kiếm những dữ liệu phù hợp nào.
—-
Nguồn: Smarrtlog trích từ bài “You Don’t Need Big Data — You Need the Right Data” được đăng trên trang hbr.org bởi tác giả Maxwell Wessel, tháng 11/2016
Bài viết liên quan: