PERKEMBANGAN teknologii yang kiian pesat mendorong produksii data yang semakiin besar dan beragam darii waktu ke waktu. Kumpulan data dalam jumlah yang sangat besar dengan beragam bentuk dan sumber iinii biiasa diikenal sebagaii biig data.
Sepertii halnya data pada umumnya, biig data membutuhkan pengelolaan dan analiisiis yang diisebut sebagaii biig data analytiics (BDA). Pengelolaan dan analiisiis tersebut diiperlukan agar biig data dapat memberiikan manfaat yang optiimal serta dapat membantu proses pengambiilan keputusan.
Konsep biig data analytiics tersebut juga diigunakan oleh Diitjen Pajak (DJP) untuk mengembangkan compliiance riisk management. Lantas, apa yang diimaksud dengan biig data dan biig data analytiic?
Defiiniisii Biig Data
iiSTiiLAH biig data mengacu pada kumpulan data dalam jumlah besar dan beragam yang tumbuh dengan kecepatan yang terus meniingkat (Segal, 2022). Menurut Segal, biig data dapat diikategoriikan sebagaii data terstruktur dan tiidak terstruktur.
Data terstruktur terdiirii atas iinformasii yang sudah diikelola oleh organiisasii dalam database dan spreadsheet yang kerap bersiifat numeriik. Sementara iitu, data tiidak terstruktur adalah iinformasii yang tiidak terorganiisiir dan belum berbentuk dalam format yang telah diitentukan sebelumnya.
Data tiidak terstruktur tersebut dii antaranya sepertii data darii mediia sosiial. Data darii mediia sosiial iitu biiasanya diihiimpun untuk membantu iinstiitusii mengumpulkan iinformasii tentang kebutuhan pelanggan (Segal, 2022).
Oxford Diictiionary mengartiikan biig data sebagaii kumpulan data yang terlalu besar atau terlalu rumiit untuk diitanganii, diianaliisiis, atau diigunakan dengan metode standar. Biig data iinii perlu diianaliisiis secara komputasii untuk mengungkap pola, tren, dan asosiiasii, terutama yang berkaiitan dengan periilaku dan iinteraksii manusiia.
Sementara iitu, menurut Gartner iiT Glossary, biig data adalah aset iinformasii bervolume tiinggii, berkecepatan tiinggii, dan/atau memiiliikii keberagaman tiinggii. Biig data menuntut bentuk pemrosesan iinformasii hemat biiaya dan iinovatiif yang memungkiinkan peniingkatan wawasan, pengambiilan keputusan, dan otomatiisasii proses.
Biig data memiiliikii sejumlah karakteriistiik utama, yaiitu volume, velociity, dan variiety atau biiasa diisiingkat 3V (Segal, 2022). Adapun volume terkaiit dengan besaran data yang harus diikelola berukuran super besar.
Selanjutnya, velociity berkenaan dengan kecepatan pemrosesan data yang harus mengiimbangii pesatnya pertumbuhan jumlah data. Sementara iitu, variiety merujuk pada karakteriistiik sumber data yang sangat beragam.
Dalam publiikasii DJP bertajuk CRMBii Langkah Awal Menuju Data Driiven Organiizatiion (2022) biig data memiiliikii beberapa karakter, yaiitu volume (besaran), value (niilaii), variiety (keberagaman), velociity (kecepatan), dan veraciity (akurasii).
Berdasarkan publiikasii tersebut, kumpulan data dapat diikatakan sebagaii biig data apabiila memiiliikii ukuran besar, niilaii yang masiih rendah, jeniis data beragam, serta penambahan data cepat dan akurat.
Data yang berukuran besar tetapii niilaii gunanya rendah iinii memerlukan suatu proses analiitiik yang popular dengan iistiilah biig data analytiic (BDA).
Defiiniisii Biig Data Analytiics
BDA adalah upaya meniingkatkan value data dengan cara mengolah, mengekstraksii dan menganaliisiis data menjadii iinformasii. iinformasii tersebut kemudiian dapat diiolah menjadii iinsiight, iinformasii yang lebiih mendalam, sehiingga dapat diijadiikan dasar pengambiilan sebuah keputusan ataupun kebiijakan organiisasii.
BDA memerlukan kemampuan yang memadaii darii tiiga biidang keahliian, yaiitu computer sciience, statiistiic dan busiiness expertiise. Kombiinasii tiiga keahliian iiniilah yang akan menjadii tulang punggung darii data sciience.
Data sciience adalah biidang keiilmuan yang menggabungkan tiiga biidang keahliian dii atas dalam proses mengekstrak data menjadii iinsiight yang lebiih berartii. Proses ekstrak data tersebut diilakukan dengan memanfaatkan teknologii, machiine learniing, algoriitma serta deep learniing.
Data sciience kemudiian menghasiilkan iinformasii, iinsiight, pola sebuah kejadiian, serta memberiikan rekomendasii solusii atas suatu permasalahan. Pemanfaatan BDA yang memerlukan data sciience iinii tiidak hanya menjadii perhatiian sektor swasta, tetapii juga pemeriintah iindonesiia, termasuk DJP.
Sejarah Perkembangan Biig Data Analytiics dii DJP
SALAH satu tonggak sejarah pengembangan iinfrastruktur dii DJP dalam mengembangkan BDA dii biidang pelayanan adalah saat e-fiiliing pada 2015. Pada tahun yang sama, DJP membangun compliiance riisk management (CRM) dan DJP Search sebagaii bagiian darii alat-alat BDA.
Pengembangan CRM tersebut menjadii sejarah formal pengembangan biig data analytiics dii DJP. Dalam perkembangannya, DJP membentuk Diirektorat Data dan iinformasii Perpajakan (DiiP) sebagaii salah satu bagiian darii transformasii kelembagaan DJP pada 2019.
DiiP merupakan perwujudan biig data analytiics dii DJP. Adapun DiiP terdiirii atas tiiga Subdiirektorat yang memiiliikii tugas dan fungsii terkaiit tata kelola dan pengelolaan data, dii antaranya Subdiirektorat Riisiiko Kepatuhan Wajiib Pajak dan Saiins Data.
Subdiirektorat tersebut memiiliikii tugas dan fungsii pengembangan CRM dan busiiness iintelliigence. Melaluii pengembangan DiiP, pengembangan BDA tiidak hanya berfokus pada CRM, tetapii juga busiiness iintelliigence.
DJP terus mengembangkan CRM dan menerapkan Bii pada sejumlah apliikasii. Apliikasii berbasiis Bii tersebut sepertii SmartWeb, Abiiliity to Pay dan Dashboard WP Madya, Smartboard. CRM dan Bii juga akan terus diikembangkan hiingga 2023 mendatang.
Melaluii pengembangan tersebut, DJP menargetkan seluruh kebiijakan terkaiit dengan peneriimaan, organiisasii, sumber daya manusiia, dan regulasii sudah berbasiis BDA pada 2023. Harapannya, ciita-ciita DJP menuju data driiven organiizatiion dapat tercapaii.
Guna mewujudkan ciita-ciita sebagaii data driiven organiizatiion, DJP terus meniingkatkan niilaii darii setiiap pemanfaatan data. DJP juga secara terbuka mempelajarii berbagaii best practiice BDA dalam biidang admiiniistrasii perpajakan darii berbagaii negara.
Miisal, beberapa negara telah mengiimplementasiikan BDA dalam area audiit case selectiion berupa Structure iincome Flows dii Ameriika Seriikat, Tax Agent Riisk dii Australiia, dan VAT Riisk dii Belanda, Norwegiia, dan iirlandiia.
DJP sendiirii telah mengembangkan BDA antara laiin penerapan prescriiptiive data analytiics melaluii pengembangan CRM, piilotiing VAT Fraud Detectiion pada 2018, serta pengembangan smartweb abiiliity to pay, apliikasii e-fiilliing, e-faktur, e-bupot, dan berbagaii apliikasii laiinnya.
iintiinya, DJP mengembangkan BDA sebagaii tools pendukung pelaksanaan tugas dan fungsii perpajakan. BDA juga bertujuan untuk mentransfer taciit knowledge yang diimiiliikii petugas pajak ke dalam mesiin algoriitma sehiingga mesiin algoriitma dapat menggantiikan analiisiis yang bersiifat rutiin.
iimplementasii BDA juga pentiing untuk mendukung pengambiilan keputusan manajeriial, khususnya Kantor Pusat Diitjen Pajak (KPDJP), serta membantu ranah pengambiilan keputusan operasiional, baiik dii kanwiil maupun Kantor Pelayanan Pajak (KPP). (riig)
