কিভাবে ডেটা দিয়ে শুরু করবেন

ক্রেডিট: https://www.flickr.com/photos/gleonhard/31254136671/in/photostream/

আমরা সকলেই শব্দটির কামড় শুনেছি।

"বিশ্বের মূল্যবান সম্পদটি আর তেল নয়, তবে ডেটা" - দ্য ইকোনমিস্ট

হতে পারে. তবে ডেটা যদি তেলের মতো হয় তবে অনেক সংস্থায় ডেটার অবস্থা এর সাথে সাদৃশ্যপূর্ণ:

ডিপ ওয়াটার হরিজন তেল ছড়িয়ে পড়ে

তথ্য সমুদ্রের কাছে হারিয়ে যাচ্ছে অসংখ্য ডেটা স্ট্রিম। যে কোনও ডেটা বিজ্ঞানীকে জিজ্ঞাসা করুন এবং তারা আপনাকে বলবেন যে ডেটা সায়েন্স সম্পর্কে সবচেয়ে কঠিন জিনিসটি সঠিক ডেটা ক্যাপচার করছে। তাহলে আমরা কীভাবে শুরু করব?

1. সঠিক প্রশ্ন জিজ্ঞাসা করুন

এটির জন্য ডেটা ক্যাপচার করা উভয়ই অপচয় এবং সময় সাপেক্ষ। আমাদের আমাদের মেট্রিকগুলি বের করতে হবে, যা ব্যবসায়ের লক্ষ্যগুলির উপর ভিত্তি করে হওয়া উচিত। সেরা বিক্রয় পণ্য কি কি? যেখানে ব্যবহারকারীরা মাল্টি-স্টেপ প্রক্রিয়াটি ত্যাগ করছেন? আমাদের কতজন সক্রিয় ব্যবহারকারী রয়েছে? অনেক সংস্থাগুলি তাদের স্টেকহোল্ডারদের মেট্রিকগুলি এমন কিছুর উপর ভিত্তি করে মেট্রিকগুলি উপস্থাপন করে যা তারা পরিমাপ করতে সক্ষম হয় (উদাঃ রাজস্ব) অগত্যা কী তাদের সংস্থার দিকনির্দেশনায় সর্বোত্তমভাবে প্রান্তিক হয়।

একবার আমরা জানার পরে আমরা কী পরিমাপের চেষ্টা করছি তারপরে আমরা কোথায় ডেটা সন্ধান করতে শুরু করব এবং প্রাসঙ্গিক ডেটা ক্যাপচার শুরু করার পদক্ষেপগুলি পরিকল্পনা করতে পারি determine

২. ডেটা-চালিত সংস্কৃতি সরবরাহ করুন

কোনও সংস্থা একটি নির্দিষ্ট আকারে বেড়ে গেলে তারা আর "খাঁটি অনুভূতি" খাঁটিভাবে নির্ভর করতে পারে না। সিদ্ধান্তগুলি ডেটার উপর ভিত্তি করে হওয়া উচিত এবং এই ডেটাটি সমস্ত স্তরে উপলব্ধ হওয়া দরকার।

কর্মচারীরা কি ডেটা এবং মেট্রিকগুলিতে অ্যাক্সেস করতে পারবেন বা সুরক্ষার এবং লাল টেপের উচ্চ স্তরের পিছনে রয়েছে? কর্মীদের কর্মীদের ডেটাসেটগুলিতে ডেটা অনুসন্ধান চালানোর ক্ষমতা দেওয়া উচিত (যা গোপনীয়তার প্রতি শ্রদ্ধা জানাতে বেনামে এবং সুরক্ষিত হওয়া উচিত)। একটি অভ্যন্তরীণ স্ব-পরিষেবা বিশ্লেষণ প্ল্যাটফর্ম এটির জন্য আদর্শ। এই কাজটি খোলামেলা এবং স্বচ্ছ হওয়া দরকার। কাজটি ড্যাশবোর্ডে স্থাপন করা এবং এটি সংস্থার প্রশস্তভাবে ভাগ করে নেওয়া জরুরী।

সংস্থাগুলি এই ধরণের কাজের জন্য সহায়তা, উত্সাহ এবং সংস্থান সরবরাহ করতে হবে। এর অর্থ সময় এবং অর্থ, তবে ডেটা-চালিত সংস্কৃতি আরও তাত্পর্যপূর্ণ সিদ্ধান্ত গ্রহণের প্রচার করবে।

3. ডেটা ইঞ্জিনিয়ারদের ভাড়া

ডেটা ইঞ্জিনিয়ারদের নয়, ডেটা বিজ্ঞানী নিয়োগ দেওয়া সংস্থাগুলির একটি সাধারণ ঘাটতি। ডেটা বিজ্ঞানীরা একেবারে সমালোচিত, তারা ডেটাতে নিদর্শনগুলি খুঁজে পেতে পারে, ফলাফলের পূর্বাভাস দিতে পারে এবং এমন মডেলগুলি লিখতে পারে যা নিজের উন্নতি করতে শিখতে পারে। সাবধানতা হ'ল এটি সমস্ত মানের মানের উপর নির্ভর করে। ডেটা যা কেবলমাত্র বড় ডেটা অবকাঠামো, ইটিএল এবং প্রোগ্রামিং স্বয়ংক্রিয় কর্মপ্রবাহের মাধ্যমে পুনরুদ্ধার করা যায়। এটি সাধারণত ডেটা ইঞ্জিনিয়ারের ভূমিকা। এই কাজের জন্য উপযুক্ত ব্যক্তিদের কাজ দিন এবং আরও গুরুত্বপূর্ণ, এটি করে উপভোগ করুন।

4. ছোট এবং সস্তা শুরু করুন

বড় ডেটা হাইপ ট্রেনে ঝাঁপিয়ে পড়া, একটি ডেটা সায়েন্স টিম তৈরি করা, এন্টারপ্রাইজ অ্যানালিটিক্স সফ্টওয়্যার কেনা এবং এটির জন্য দেখানোর জন্য খুব অল্প অর্থের সাথে প্রচুর অর্থ ব্যয় করা খুব লোভনীয় হতে পারে। বড় বিনিয়োগ করার আগে অনেক কিছু করা যায়। যে কোনও সংস্থা ব্যবহার করতে পারে এমন কয়েকটি সরঞ্জাম এখানে রইল:

  • জাভাস্ক্রিপ্ট বিশ্লেষণগুলি যেমন মিকস্প্যানেল বা প্রশস্ততা হিসাবে কাজ করে bs এটি মাসিক ব্যবহারকারীদের নির্দিষ্ট পরিমাণে বিনামূল্যে।
  • স্বয়ংক্রিয় কর্মপ্রবাহ পরিচালনার জন্য এয়ারফ্লো। এয়ারবিএনবি দ্বারা নির্মিত এবং অ্যাপাচি সফ্টওয়্যার ফাউন্ডেশনে সংক্রামিত, এটি ওপেন সোর্স এবং ডেটা ইঞ্জিনিয়ারদের জন্য একটি ডি স্ট্যাক্ট স্ট্যান্ডার্ড।
  • সুপারশেটের সাথে ড্যাশবোর্ড, চার্ট এবং ডেটা এক্সপ্লোরেশন (অ্যাপাচি দ্বারাও)। মেটাবেসও একটি ভাল বিকল্প এবং উভয়ই ওপেন সোর্স।
  • ডেটাব্রিক্স সম্প্রদায় সংস্করণ এবং ক্যাগল। উভয়ই ক্লাউডে ডেটা বিজ্ঞান প্রক্রিয়াগুলির জন্য এবং বিনা মূল্যে ব্যবহার করা যেতে পারে।
  • অ্যামাজন ওয়েব সার্ভিসেস এস। নিখরচায় নয় তবে এখানে অন্তর্ভুক্ত রয়েছে কারণ প্রযুক্তিগুলি আজ বিকশিত হওয়ার সাথে সাথে ডেটা গুদাম থাকা সর্বদা প্রয়োজন হয় না। স্টোরেজটি সস্তা এবং পরিষেবা যেমন ডেটাব্রিক্স, মঙ্গোডিবি ডেটা হ্রদ, এডাব্লুএস অ্যাথেনার অর্থ আপনি সরাসরি আপনার ডেটা হ্রদ থেকে পড়তে পারেন।

এই ধারণাগুলি কোনও সংস্থাকে সঠিক ডেটা ক্যাপচার এবং এর মান বুঝতে শুরু করার জন্য একটি ভাল ভিত্তি সরবরাহ করবে।