Siapa yang mengumpul data besar dan mengapa?

Pada musim gugur 2019, skandal meletus dengan perkhidmatan Apple Card: semasa mendaftar, ia mengeluarkan had kredit yang berbeza untuk lelaki dan wanita. Malah Steve Wozniak tidak bernasib baik:

Setahun sebelumnya, telah didedahkan bahawa platform Netflix menunjukkan kepada pengguna poster dan penggoda yang berbeza, bergantung pada jantina, umur dan kewarganegaraan mereka. Untuk ini, perkhidmatan itu dituduh perkauman.

Akhirnya, Mark Zuckerberg kerap ditegur kerana didakwa mengumpul, menjual dan memanipulasi data penggunanya oleh Facebook. Selama bertahun-tahun, dia telah dituduh dan juga dibicarakan untuk manipulasi semasa pilihan raya Amerika, membantu perkhidmatan khas Rusia, menghasut kebencian dan pandangan radikal, pengiklanan yang tidak sesuai, membocorkan data pengguna, menghalang penyiasatan terhadap pedofil.

Catatan Facebook oleh zuck

Pada masa yang sama, perkhidmatan dalam talian Pornhub setiap tahun menerbitkan laporan tentang jenis pornografi yang dicari oleh orang-orang lucah yang berlainan bangsa, jantina dan umur. Dan atas sebab tertentu ini tidak mengganggu sesiapa pun. Walaupun semua cerita ini serupa: dalam setiap daripada mereka kita berurusan dengan data besar, yang pada abad ke-XNUMX dipanggil "minyak baru".

Apakah data besar

Data besar – ia juga merupakan data besar (ms. Big Data) atau metadata – ialah susunan data yang tiba dengan kerap dan dalam jumlah yang besar. Ia dikumpul, diproses dan dianalisis, menghasilkan model dan corak yang jelas.

Contoh yang menarik ialah data daripada Large Hadron Collider, yang datang secara berterusan dan dalam kuantiti yang banyak. Dengan bantuan mereka, saintis menyelesaikan banyak masalah.

Tetapi data besar di web bukan sahaja statistik untuk penyelidikan saintifik. Mereka boleh digunakan untuk menjejaki cara pengguna kumpulan dan kewarganegaraan berbeza berkelakuan, perkara yang mereka beri perhatian dan cara mereka berinteraksi dengan kandungan. Kadang-kadang, untuk ini, data dikumpulkan bukan dari satu sumber, tetapi dari beberapa, membandingkan dan mengenal pasti corak tertentu.

Mengenai betapa pentingnya data besar pada rangkaian, mereka mula bercakap apabila terdapat banyak data. Pada awal tahun 2020, terdapat 4,5 bilion pengguna Internet di dunia, di mana 3,8 bilion telah didaftarkan dalam rangkaian sosial.

Siapa yang mempunyai akses kepada Data Besar

Menurut tinjauan, lebih separuh daripada negara kita percaya bahawa data mereka pada rangkaian digunakan oleh pihak ketiga. Pada masa yang sama, ramai yang menyiarkan maklumat peribadi, foto, dan juga nombor telefon pada rangkaian sosial dan aplikasi.

Siapa yang mengumpul data besar dan mengapa?
Siapa yang mengumpul data besar dan mengapa?
Siapa yang mengumpul data besar dan mengapa?
Siapa yang mengumpul data besar dan mengapa?

Ia perlu dijelaskan di sini: orang pertama ialah pengguna itu sendiri, yang meletakkan datanya pada mana-mana sumber atau aplikasi. Pada masa yang sama, dia bersetuju (meletakkan tanda dalam perjanjian) untuk pemprosesan data ini pihak kedua – iaitu pemilik sumber. Pihak ketiga ialah mereka yang pemilik sumber boleh memindahkan atau menjual data pengguna. Selalunya ini ditulis dalam perjanjian pengguna, tetapi tidak selalu.

Pihak ketiga ialah agensi kerajaan, penggodam atau syarikat yang membeli data untuk tujuan komersial. Yang pertama boleh mendapatkan data melalui keputusan mahkamah atau pihak berkuasa yang lebih tinggi. Penggodam, sudah tentu, tidak menggunakan sebarang kebenaran – mereka hanya menggodam pangkalan data yang disimpan pada pelayan. Syarikat (mengikut undang-undang) hanya boleh mengakses data jika anda sendiri membenarkannya – dengan menandai kotak di bawah perjanjian. Jika tidak, ia adalah haram.

Mengapa syarikat menggunakan Data Besar?

Data besar dalam bidang komersial telah digunakan selama beberapa dekad, cuma ia tidak sehebat sekarang. Ini adalah, sebagai contoh, rekod daripada kamera pengawasan, data daripada navigator GPS atau pembayaran dalam talian. Kini, dengan pembangunan rangkaian sosial, perkhidmatan dalam talian dan aplikasi, semua ini boleh disambungkan dan mendapatkan gambaran yang paling lengkap: di mana bakal pelanggan tinggal, perkara yang mereka suka tonton, ke mana mereka pergi bercuti dan jenama kereta yang mereka miliki.

Daripada contoh di atas, jelas bahawa dengan bantuan data besar, syarikat, pertama sekali, ingin menyasarkan iklan. Iaitu, untuk menawarkan produk, perkhidmatan atau pilihan individu hanya kepada khalayak yang betul dan juga menyesuaikan produk untuk pengguna tertentu. Di samping itu, pengiklanan di Facebook dan platform besar lain menjadi semakin mahal, dan menunjukkannya kepada semua orang berturut-turut sama sekali tidak menguntungkan.

Maklumat tentang bakal pelanggan daripada sumber terbuka digunakan secara aktif oleh syarikat insurans, klinik swasta dan majikan. Yang pertama, sebagai contoh, boleh menukar syarat insurans jika mereka melihat bahawa anda sering mencari maklumat tentang penyakit atau ubat tertentu, dan majikan boleh menilai sama ada anda terdedah kepada konflik dan tingkah laku antisosial.

Tetapi terdapat satu lagi tugas penting yang telah bergelut sejak beberapa tahun kebelakangan ini: untuk mendekati khalayak yang paling pelarut. Ini tidak begitu mudah untuk dilakukan, walaupun tugas itu dipermudahkan dengan ketara oleh perkhidmatan pembayaran dan cek elektronik melalui satu OFD (pengendali data fiskal). Untuk mendekati sedekat mungkin, syarikat juga cuba menjejaki dan "memupuk" bakal pelanggan dari zaman kanak-kanak.: melalui permainan dalam talian, mainan interaktif dan perkhidmatan pendidikan.

Bagaimana ia berfungsi?

Peluang terbesar untuk pengumpulan data adalah daripada syarikat global yang memiliki beberapa perkhidmatan sekaligus. Facebook kini mempunyai lebih daripada 2,5 bilion pengguna aktif. Pada masa yang sama, syarikat itu juga memiliki perkhidmatan lain: Instagram - lebih daripada 1 bilion, WhatsApp - lebih daripada 2 bilion dan lain-lain.

Tetapi Google mempunyai pengaruh yang lebih besar: Gmail digunakan oleh 1,5 bilion orang di dunia, 2,5 bilion lagi oleh OS mudah alih Android, lebih daripada 2 bilion oleh YouTube. Dan itu belum termasuk carian Google dan apl Peta Google, gedung Google Play dan penyemak imbas Chrome. Ia kekal untuk mengikat bank dalam talian anda - dan Google akan dapat mengetahui secara literal segala-galanya tentang anda. Dengan cara ini, Yandex sudah selangkah ke hadapan dalam hal ini, tetapi ia hanya meliputi penonton berbahasa Rusia.



👍 Pertama sekali, syarikat berminat dengan apa yang kami siarkan dan suka di rangkaian sosial. Sebagai contoh, jika bank melihat bahawa anda sudah berkahwin dan secara aktif menyukai gadis di Instagram atau Tinder, anda berkemungkinan besar untuk meluluskan pinjaman pengguna. Dan gadai janji pada keluarga telah hilang.

Ia juga penting tentang iklan yang anda klik, kekerapan dan hasil.

(Ie Langkah seterusnya ialah mesej peribadi: ia mengandungi lebih banyak maklumat. Mesej telah dibocorkan di VKontakte, Facebook, WhatsApp dan mesej segera yang lain. Menurut mereka, dengan cara ini, adalah mudah untuk mengesan geolokasi pada masa menghantar mesej. Pasti anda perasan: apabila anda berbincang untuk membeli sesuatu atau hanya memesan piza dengan seseorang, pengiklanan yang berkaitan serta-merta muncul dalam suapan.

🚕 Data besar digunakan secara aktif dan "bocor" oleh perkhidmatan penghantaran dan teksi. Mereka tahu di mana anda tinggal dan bekerja, apa yang anda suka, berapa anggaran pendapatan anda. Uber, sebagai contoh, menunjukkan harga yang lebih tinggi jika anda memandu pulang dari bar dan jelas berlebihan. Dan apabila anda mempunyai sekumpulan agregator lain pada telefon anda, sebaliknya, mereka akan menawarkan yang lebih murah.

(Ie Terdapat perkhidmatan yang menggunakan foto dan video untuk mengumpul maklumat sebanyak mungkin. Sebagai contoh, perpustakaan penglihatan komputer - Google mempunyai satu. Mereka mengimbas anda dan persekitaran anda untuk melihat saiz atau ketinggian anda, jenama yang anda pakai, kereta yang anda pandu, sama ada anda mempunyai anak atau haiwan peliharaan.

(Ie Mereka yang menyediakan gerbang SMS kepada bank untuk mel mereka boleh menjejaki pembelian anda pada kad – mengetahui 4 digit terakhir dan nombor telefon – dan kemudian menjual data ini kepada orang lain. Oleh itu semua spam ini dengan diskaun dan pizza sebagai hadiah.

🤷️️ Akhirnya, kami sendiri membocorkan data kami ke perkhidmatan dan aplikasi sebelah kiri. Ingat gembar-gembur di sekitar Getcontact, apabila semua orang gembira mengisi nombor telefon mereka untuk mengetahui cara ia ditulis oleh orang lain. Dan sekarang cari persetujuan mereka dan baca apa yang dikatakan tentang pemindahan data anda (spoiler: pemilik boleh memindahkannya kepada pihak ketiga mengikut budi bicara mereka):

Siapa yang mengumpul data besar dan mengapa?

Syarikat-syarikat boleh berjaya mengumpul dan juga menjual data pengguna selama bertahun-tahun, sehingga ia datang kepada tuntutan mahkamah - seperti yang berlaku dengan Facebook yang sama. Dan kemudian peranan yang menentukan dimainkan oleh pelanggaran GDPR syarikat - undang-undang di EU yang menyekat penggunaan data dengan lebih ketat daripada Amerika. Satu lagi contoh terbaru ialah skandal antivirus Avast: salah satu perkhidmatan anak syarikat syarikat mengumpul dan menjual data daripada 100 hingga 400 juta pengguna.

Tetapi adakah semua ini mempunyai kelebihan untuk kita?

Sejauh manakah data besar membantu kita semua?

Ya, ada sisi baiknya juga.

Data besar membantu menangkap penjenayah dan mencegah serangan pengganas, mencari kanak-kanak yang hilang dan melindungi mereka daripada bahaya.

Dengan bantuan mereka, kami kami menerima tawaran hebat daripada bank dan diskaun peribadi. Terima kasih kepada mereka kita kami tidak membayar untuk banyak perkhidmatan dan rangkaian sosial yang memperoleh hanya pada pengiklanan. Jika tidak, Instagram sahaja akan menelan belanja beberapa ribu ringgit sebulan.

Facebook sahaja mempunyai 2,4 bilion pengguna aktif. Pada masa yang sama, keuntungan mereka untuk 2019 berjumlah $18,5 bilion. Ternyata syarikat itu memperoleh sehingga $7,7 setahun daripada setiap pengguna melalui pengiklanan.

Akhir sekali, kadangkala ia hanya mudah: apabila perkhidmatan sudah tahu di mana anda berada dan perkara yang anda mahukan, dan anda tidak perlu mencari maklumat yang anda perlukan sendiri.

Satu lagi bidang yang menjanjikan untuk aplikasi Data Besar ialah pendidikan.

Di salah satu universiti Amerika di Virginia, satu kajian telah dijalankan untuk mengumpul data mengenai pelajar kumpulan risiko yang dipanggil. Ini adalah mereka yang belajar dengan teruk, ponteng kelas dan akan tercicir. Hakikatnya di negeri-negeri setiap tahun kira-kira 400 orang dipotong. Ini adalah buruk untuk universiti, yang telah menurunkan penarafan dan pemotongan pembiayaan mereka, dan untuk pelajar sendiri: ramai yang mengambil pinjaman untuk pendidikan, yang, selepas potongan, masih perlu dibayar balik. Apatah lagi kehilangan masa dan prospek kerjaya. Dengan bantuan data besar, adalah mungkin untuk mengenal pasti ketinggalan dalam masa dan menawarkan mereka tutor, kelas tambahan dan bantuan lain yang disasarkan.

Ini, dengan cara ini, juga sesuai untuk sekolah: maka sistem akan memberitahu guru dan ibu bapa – mereka berkata, kanak-kanak itu mempunyai masalah, mari kita bantu dia bersama-sama. Big Data juga akan membantu anda memahami buku teks yang berfungsi lebih baik dan guru yang menerangkan bahan dengan lebih mudah.

Satu lagi contoh positif ialah profil kerjaya.: inilah masanya remaja dibantu untuk membuat keputusan tentang profesion masa depan mereka. Di sini, data besar membolehkan anda mengumpul maklumat yang tidak boleh diperoleh menggunakan ujian tradisional: bagaimana pengguna berkelakuan, perkara yang dia beri perhatian, cara dia berinteraksi dengan kandungan.

Di USA yang sama, terdapat program bimbingan kerjaya - SC ACCELERATE. Ia, antara lain, menggunakan teknologi GPS CareerChoice: mereka menganalisis data tentang sifat pelajar, kecenderungan mereka terhadap mata pelajaran, kekuatan dan kelemahan. Data tersebut kemudiannya digunakan untuk membantu remaja memilih kolej yang sesuai untuk mereka.


Langgan dan ikuti kami di Yandex.Zen — teknologi, inovasi, ekonomi, pendidikan dan perkongsian dalam satu saluran.

Sila tinggalkan balasan anda