أدى النمو الهائل للإنترنت وإنترنت الأشياء والحوسبة السحابية في الآونة الأخيرة إلى ارتفاع كبير في البيانات عبر مختلف قطاعات الأعمال والصناعة. أصبحت البيانات الضخمة اتجاها متزايدا في السنوات الأخيرة، حيث جذبت انتباه الأكاديميين وقادة الشركات والمسؤولين الحكوميين في جميع أنحاء العالم. Hadoop هو إطار عمل شائع الاستخدام لمعالجة البيانات الضخمة. إن توسيع البيانات هذا لديه القدرة على توفير مزايا كبيرة ومفيدة، وقد تم تحقيق بعض النجاح المبكر من الناحية الفنية في التعامل مع مثل هذه الكمية الكبيرة من البيانات. فإلى جانب فوائده العديدة، فإن له أيضًا عددًا كبيرًا من العيوب. وتشمل هذه، على سبيل المثال لا الحصر، تخزين البيانات وتبادلها وتنظيمها ونقلها وتحليلها وتصورها وأمنها وخصوصيتها. في هذا البحث، يتم دراسة الآثار المترتبة على الخصوصية لتحليلات البيانات الضخمة. تقترح العديد من المنشورات طرقًا لتأمين البيانات الضخمة. كل تقنية لها مزايا وعيوب. بغض النظر عن قوانين الخصوصية، يجب على مطوري التطبيقات حماية البيانات الحساسة.