پیتر تیل بنیانگذار پیپال معمولا جامعهی فناوری را برای استفاده از بزرگدادهها ترغیب میکند. هرچند او تنها کسی نیست که این کار را میکند، ولی گویی بسیاری از شرکتها هنوز این پیام را به خوبی درک نکردهاند.
اغلب شرکتها ترابایت و پتابایتهایی از دادهها را جمعآوری میکنند و احساس میکنند که از مزیت رقابتی برخوردار هستند. اما حقیقت این است که بیشتر شرکتها به دلیل بیش از حد بودن دادهها رنج میبرند، همانطور که ضربالمثل gigo میگوید ورودی بد منجر به خروجی بد خواهد شد. نه تنها بسیاری از شرکتها دادههای پیچیده و با حجم بسیار زیاد دارند، اغلب آنها دادههای بد دارند. دادههایی که ممکن است حتی به کسبوکار آنها صدمه نیز بزند. با توجه به گزارشهای Experian دادههای نادرست روی ۸۸ درصد از سازمانها تاثیر میگذارد و تا ۱۲ درصد روی درآمد آنها موثر است.
بزرگدادههای خوب
برخی از شرکتهای بزرگ واقعا دادههای خوبی دارند و میدانند که چگونه از آنها استفاده کنند، این شرکتها توانستهاند با موفقیت، مقدار زیادی از دادهها را جمعآوری کنند و با استفاده از آنها به تصمیمگیری مبتنی بر دادههای صحیح بپردازند.
نتفلیکس
نتفلیکس دادههای زیادی را در مورد عادات مشاهده کاربران جمعآوری کرده است و آنها را برحسب منطقه، زمان از روز، ساعت تماشا و مجموعههای دیگر دستهبندی میکند تا به کابران آنچه را که میخواهند ارائه میکند. این امر آنها را در موقعیتی منحصر به فرد قرار میدهد تا بتوانند آنچه را که بینندگانشان میخواهند پیشبینی کنند.
این موضوع باعث میشود که نتفیلیکس فراتر از یک شرکت خدمات آنلاین دیویدی باشد و تبدیل به شرکتی تولیدی توسعه یافته شود که سریالهای موفقی مثل House of Cards را تولید کند.
آیبیام و شرکت Weather
شرکت آیبیام با همکاری شرکت weather تیمی را تشکیل دادهاند و درصدد جمعآوری بسیاری از دادهها و تجزیهوتحلیل آنها هستند تا چگونگی اثرات آبوهوا را روی کسبوکارها تحلیل کنند. این دادهها دربرگیرندهی همهچیز از خردهفروشی تا شرکتهای بیمه است. به عنوان مثال آنها به زودی قادر خواهند بود تا بینشی ارائه دهد که نشان دهد درجهی حرارت چگونه بر روی فروش تاثیر میگذارد.
دانشکده پزشکی کوه سینا
این مدرسه که در نیویورک قرار دارد، جف هامرباچر یکی از معروفترین دانشمندان اطلاعاتی کنونی را به توسعهی یک کامپیوتر که بتواند اطلاعات پزشکی یک ونیم میلیون نفر را در سال تجزیه وتحلیل کند، موظف کرده است.
جف هامرباچر با همکاری رئیس موسسه کوه سینا در تلاش هستند تا پیشبینیهایی را انجام دهند که منجر به کاهش هزینهی مراقبتهای بهداشتی شود. با ارزیابی تاریخچه پزشکی بیمار و عوامل خطر برای تعیین اینکه آنها اغلب به چه مراقبتهای بهداشتی نیاز دارند. همچنین این امکان را به پزشکان ارائه میکند تا با توجه به ارزیابیهای انجام شده و مدلهای ریسک جمعآوری شده از ژنومیکس و دادههای آزمایشگاهی بهترین درمان را تجویز کند.
آمازون
آمازون به بینش بیسابقهای نسبت به کاربرانش دست پیدا کرده است. این شرکت ارتباطات و روابط مستقیم با مصرفکنندگان را پراهمیت و کلید موفقیت کسبوکار خودش میداند. آمازون با حجم عظیمی از دادههای کاربران، تجزیه و تحلیل آنها و با ارائهی پشتیبانی سریع، سعی در تحکیم وفاداری مشتریانش دارد.
زیراکس
بدر حالیکه تجربهی کاری گذشته اغلب مدلی برای استخدام کارمندان جدید بوده است، زیراکس نشان داد که برای رسیدن به موفقیت و داشتن بهترین استخدامها میتوان به صورت کاملا متفاوت عمل کرد. با استفاده از دادههای بزرگ سازمان شخصیت یک کارمند بالقوه را پیشبینی میکند و سپس متوجه میشود که این شغل مناسب وی است یا نه!
با این وجود بسیاری از شرکتها از دادههای خود به خوبی استفاده نمیکنند.
بزرگدادههای بد
بسیاری از شرکتهایی حجم بزرگی از دادههای بد دارند، زمان بسیار کمی را صرف فکر کردن در مورد آنچه که باید جمعآوری کنند و چگونه جمعآوری کنند میکنند. به جای اینکه دادههای مفیدی را صید کنند در میان اقیانوسی از دادههای بیمصرف غوطهور میشوند.
ساختن یک سازمان با اطلاعات هوشمندانه و قابل استفاده چیزی است که هر شرکت برای ایجاد آن باید تلاش کند.
دیجی پاتیل دانشمند ارشد دادههای کاخ سفید، به طور خلاصه به مشکلاتی که دادهها ایجاد میکنند اشاره کرده و میگوید:
شما باید با یک ایدهی بسیار اساسی شروع کنید، اطلاعات فوقالعاده کثیف هستند و پاکسازی دادهها همیشه ۸۰ درصد از کار خواهد شد.
براساس تحقیقات Wikibon حدود ۵۲ درصد از سرمایهگذاریها روی ابزارهای سازماندهی دادهها صرف میشود، تا آنها را در دسترس و آماده برای تجزیه و تحلیل بکند.
در کسبوکار خود از بزرگدادهها استفاده کنید.
داشتن بزرگدادهها به تنهایی احمقانه است، بنابراین برای ایجاد سازمانی با اطلاعات هوشمند و قابل استفاده تلاش کنید. نکات زیر در این راه به شما کمک خواهند کرد.
برای شروع باید درک کنید که شما نیاز به چه دادههایی برای تجزیه و تحلیل دارید. اطلاعات رویدادی، اطلاعات مالی، دادههای نموداری یا چیزهای دیگر؟ اینها مهمترین عوامل در تعیین این هستند که آیا شما نیاز به گرفتن اطلاعات در سطح اتمی دارید و یا در برخی فرمتهای دیگر.
بسیاری از کسبوکارها تجزیه و تحلیل را بدون دخالت کاربران واقعی کسبوکارها به توسعهدهندگان و فناوری اطلاعات میسپارند. در حالی که برای جلوگیری از مشکلاتی که در پایان ممکن است به وجود بیاید باید کسانی که از دادهها استقاده میکنند دقیقا درک کنند که دادهها چگونه جمعآوری شدهاند.
دادههای بد منجر به نتایج بدی خواهند شد، آیا از منبع و نوع دادههایی که جمعآوری خواهید کرد مطمئن هستید؟ دادههای شما از کجا سرچشمه میگیرند؟ آیا آنها دادههای صحیحی هستند؟ اگر پاسخ این سوالات را نمیدانید، هیچ کاری نکنید بلکه به دنبال جواب آنها باشید.