پیتر تیل بنیانگذار پی‌پال معمولا جامعه‌ی فناوری را برای استفاده از بزرگ‌داده‌ها ترغیب می‌کند. هرچند او تنها کسی نیست که این کار را می‌کند، ولی گویی بسیاری از شرکت‌ها هنوز این پیام را به خوبی درک نکرده‌اند.

اغلب شرکت‌ها ترابایت و پتابایت‌هایی از داده‌ها را جمع‌آوری می‌کنند و احساس می‌کنند که از مزیت رقابتی برخوردار هستند. اما حقیقت این است که بیشتر شرکت‌ها به دلیل بیش از حد بودن داده‌ها رنج می‌برند، همان‌طور که ضرب‌المثل gigo می‌گوید ورودی بد منجر به خروجی بد خواهد شد. نه تنها بسیاری از شرکت‌ها داده‌های پیچیده و با حجم بسیار زیاد دارند، اغلب آن‌ها داده‌های بد دارند. داده‌هایی که ممکن است حتی به کسب‌وکار آن‌ها صدمه نیز بزند. با توجه به گزارش‌های  Experian داده‌های نادرست روی ۸۸ درصد از سازمان‌ها تاثیر می‌گذارد و تا ۱۲ درصد روی درآمد آن‌ها موثر است.

بزرگ‌داده‌های خوب

برخی از شرکت‌های بزرگ واقعا داده‌های خوبی دارند و می‌دانند که چگونه از آن‌ها استفاده کنند، این شرکت‌ها توانسته‌اند با موفقیت، مقدار زیادی از داده‌ها را جمع‌آوری کنند و با استفاده از آن‌ها به تصمیم‌گیری مبتنی بر داده‌های صحیح بپردازند.

نتفلیکس

نتفلیکس داده‌های زیادی را در مورد عادات مشاهده کاربران جمع‌آوری کرده است و آن‌ها را برحسب منطقه، زمان از روز، ساعت تماشا و مجموعه‌های دیگر دسته‌بندی می‌کند تا به کابران آن‌چه را که می‌خواهند ارائه می‌کند. این امر آن‌ها را در موقعیتی منحصر به فرد قرار می‌دهد تا بتوانند آن‌چه را که بینندگان‌شان می‌خواهند پیش‌بینی کنند.

این موضوع باعث می‌شود که نتفیلیکس فراتر از یک شرکت خدمات آنلاین دی‌وی‌دی باشد و تبدیل به شرکتی تولیدی توسعه یافته شود که سریال‌های موفقی مثل House of Cards را تولید کند.

آی‌بی‌ام و شرکت Weather

شرکت آی‌بی‌ام با همکاری شرکت weather تیمی را تشکیل داده‌اند و درصدد جمع‌آوری بسیاری از داده‌ها و تجزیه‌وتحلیل آن‌ها هستند تا چگونگی اثرات آب‌وهوا را روی کسب‌وکارها تحلیل کنند. این داده‌ها دربرگیرنده‌ی همه‌چیز از خرده‌فروشی تا شرکت‌های بیمه است. به عنوان مثال آن‌ها به زودی قادر خواهند بود تا بینشی ارائه دهد که نشان دهد درجه‌ی حرارت چگونه بر روی فروش تاثیر می‌گذارد.

دانشکده پزشکی کوه سینا

این مدرسه که در نیویورک قرار دارد، جف هامرباچر یکی از معروف‌ترین دانشمندان اطلاعاتی کنونی را به توسعه‌ی یک کامپیوتر که بتواند  اطلاعات پزشکی یک ونیم میلیون نفر را در سال تجزیه وتحلیل کند، موظف کرده است.

جف هامرباچر با همکاری رئیس موسسه کوه سینا در تلاش هستند تا پیش‌بینی‌هایی را انجام دهند که منجر به کاهش هزینه‌ی مراقبت‌های بهداشتی شود. با ارزیابی تاریخچه پزشکی بیمار و عوامل خطر برای تعیین این‌که آن‌ها اغلب به چه مراقبت‌های بهداشتی نیاز دارند. هم‌چنین این امکان را به پزشکان ارائه می‌کند تا با توجه به ارزیابی‌های انجام شده و مدل‌های ریسک جمع‌آوری شده از ژنومیکس و داده‌های آزمایشگاهی بهترین درمان را تجویز کند.

آمازون

آمازون به بینش بی‌سابقه‌ای نسبت به کاربرانش دست پیدا کرده است. این شرکت ارتباطات و روابط مستقیم با مصرف‌کنندگان را پراهمیت و کلید موفقیت کسب‌وکار خودش می‌داند. آمازون با حجم عظیمی از داده‌های کاربران، تجزیه و تحلیل آن‌ها و با ارائه‌ی پشتیبانی سریع، سعی در تحکیم وفاداری مشتریانش دارد.

زیراکس

بدر حالی‌که تجربه‌ی کاری گذشته اغلب مدلی برای استخدام کارمندان جدید بوده است، زیراکس نشان داد که برای رسیدن به موفقیت و داشتن بهترین استخدام‌ها می‌توان به صورت کاملا متفاوت عمل کرد. با استفاده از داده‌های بزرگ سازمان شخصیت یک کارمند بالقوه را پیش‌بینی می‌کند و سپس متوجه می‌شود که این شغل مناسب وی است یا نه!


با این وجود بسیاری از شرکت‌ها از داده‌های خود به خوبی استفاده نمی‌کنند.

بزرگ‌داده‌های بد

بسیاری از شرکت‌هایی حجم بزرگی از داده‌های بد دارند، زمان بسیار کمی را صرف فکر کردن در مورد آ‌ن‌چه که باید جمع‌آوری کنند و چگونه جمع‌آوری کنند می‌کنند. به جای این‌که داده‌های مفیدی را صید کنند در میان اقیانوسی از داده‌های بی‌مصرف غوطه‌ور می‌شوند.

ساختن یک سازمان با اطلاعات هوشمندانه و قابل استفاده چیزی است که هر شرکت برای ایجاد آن باید تلاش کند.

دی‌جی پاتیل دانشمند ارشد داده‌های کاخ سفید، به طور خلاصه به مشکلاتی که داده‌ها ایجاد می‌کنند اشاره کرده و می‌گوید:

شما باید با یک ایده‌ی بسیار اساسی شروع کنید، اطلاعات فوق‌العاده کثیف هستند و پاکسازی داده‌‍‌ها همیشه ۸۰ درصد از کار خواهد شد.

براساس تحقیقات Wikibon حدود ۵۲ درصد از سرمایه‌گذاری‌ها روی ابزارهای سازماندهی داده‌ها صرف می‌شود، تا آن‌ها را در دسترس و آماده برای تجزیه و تحلیل بکند.

در کسب‌وکار خود از بزرگ‌داده‌ها استفاده کنید.

داشتن بزرگ‌داده‌ها به تنهایی احمقانه است، بنابراین برای ایجاد سازمانی با اطلاعات هوشمند و قابل استفاده تلاش کنید. نکات زیر در این راه به شما کمک خواهند کرد.

برای شروع باید درک کنید که شما نیاز به چه داده‌هایی برای تجزیه و تحلیل دارید. اطلاعات رویدادی، اطلاعات مالی، داده‌های نموداری یا چیزهای دیگر؟ این‌ها مهم‌ترین عوامل در تعیین این‌ هستند که آیا شما نیاز به گرفتن اطلاعات در سطح اتمی دارید و یا در برخی فرمت‌های دیگر.

بسیاری از کسب‌وکارها تجزیه و تحلیل را بدون دخالت کاربران واقعی کسب‌وکارها به توسعه‌دهندگان و فناوری اطلاعات می‌سپارند. در حالی که برای جلوگیری از مشکلاتی که در پایان ممکن است به وجود بیاید باید کسانی که از داده‌ها استقاده می‌کنند دقیقا درک کنند که داده‌ها چگونه جمع‌آوری شده‌اند.

داده‌های بد منجر به نتایج بدی خواهند شد، آیا از منبع و نوع داده‌هایی که جمع‌آوری خواهید کرد مطمئن هستید؟ داده‌های شما از کجا سرچشمه می‌گیرند؟ آیا آن‌ها داده‌های صحیحی هستند؟ اگر پاسخ این سوالات را نمی‌دانید، هیچ کاری نکنید بلکه به دنبال جواب آن‌ها باشید.