CentOS 7 এ একা নোডে অ্যাপাচি হ্যাডুপ কীভাবে ইনস্টল এবং কনফিগার করবেন


অ্যাপাচি হ্যাডোপ কম্পিউটার ক্লাস্টারগুলিতে বিতরণ করা বিগ ডেটা স্টোরেজ এবং প্রসেসিং ডেটার জন্য একটি ওপেন সোর্স ফ্রেমওয়ার্ক বিল্ড। প্রকল্পটি নিম্নলিখিত উপাদানগুলির উপর ভিত্তি করে:

  1. হ্যাডোপ কমন - এতে জাভা লাইব্রেরি এবং অন্যান্য হ্যাডোপ মডিউলগুলির প্রয়োজনীয় ইউটিলিটি রয়েছে
  2. এইচডিএফএস - হ্যাডোপ বিতরণকারী ফাইল সিস্টেম - একাধিক নোড জুড়ে বিতরণ করা একটি জাভা ভিত্তিক স্কেলযোগ্য ফাইল সিস্টেম
  3. মানচিত্রে - সমান্তরাল বড় ডেটা প্রক্রিয়াকরণের জন্য YARN কাঠামো
  4. হাদুপ ইয়ার্ন: ক্লাস্টার রিসোর্স ম্যানেজমেন্টের জন্য একটি কাঠামো

এই নিবন্ধটি আপনাকে সেন্টোস 7-তে (আরএইচইএল 7 এবং ফেডোরা 23+ সংস্করণেও কাজ করে) একক নোড ক্লাস্টারে অ্যাপাচি হ্যাডোপ ইনস্টল করতে পারে সে সম্পর্কে আপনাকে গাইড করবে। এই ধরণের কনফিগারেশন হ্যাডোপ সিউডো-বিতরণ মোড হিসাবেও উল্লেখ করা হয়।

পদক্ষেপ 1: CentOS 7 এ জাভা ইনস্টল করুন

১. জাভা ইনস্টলেশন নিয়ে যাওয়ার আগে প্রথমে রুট ব্যবহারকারীর সাথে লগইন করুন বা রুট সুবিধাগুলি সহ একটি ব্যবহারকারী নীচের কমান্ডের সাহায্যে আপনার মেশিনের হোস্টনাম সেটআপ করুন।

# hostnamectl set-hostname master

এছাড়াও, আপনার সিস্টেমের আইপি ঠিকানায় ইঙ্গিত করতে আপনার নিজের মেশিন এফকিউডিএন দিয়ে হোস্ট ফাইলগুলিতে একটি নতুন রেকর্ড যুক্ত করুন।

# vi /etc/hosts

নীচের লাইনটি যুক্ত করুন:

192.168.1.41 master.hadoop.lan

উপরের হোস্টনাম এবং এফকিউডিএন রেকর্ডগুলি আপনার নিজের সেটিংসের সাথে প্রতিস্থাপন করুন।

২. এরপরে, ওরাকল জাভা ডাউনলোড পৃষ্ঠায় যান এবং কার্ল কমান্ডের সাহায্যে আপনার সিস্টেমে জাভা এসই বিকাশ কিট 8 এর সর্বশেষতম সংস্করণটি ধরুন:

# curl -LO -H "Cookie: oraclelicense=accept-securebackup-cookie" “http://download.oracle.com/otn-pub/java/jdk/8u92-b14/jdk-8u92-linux-x64.rpm”

৩. জাভা বাইনারি ডাউনলোড শেষ হওয়ার পরে, নীচের কমান্ডটি জারি করে প্যাকেজটি ইনস্টল করুন:

# rpm -Uvh jdk-8u92-linux-x64.rpm

পদক্ষেপ 2: সেন্টোস 7 এ হ্যাডোপ ফ্রেমওয়ার্ক ইনস্টল করুন

৪. এরপরে, রুট শক্তি ছাড়াই আপনার সিস্টেমে একটি নতুন ব্যবহারকারী অ্যাকাউন্ট তৈরি করুন যা আমরা এটি হ্যাডোপ ইনস্টলেশন পন্থা এবং কার্যকারী পরিবেশের জন্য ব্যবহার করব। নতুন অ্যাকাউন্ট হোম ডিরেক্টরিটি /opt/hadoop ডিরেক্টরিতে থাকবে।

# useradd -d /opt/hadoop hadoop
# passwd hadoop

৫. পরবর্তী পদক্ষেপে সর্বশেষতম স্থিতিশীল সংস্করণের লিঙ্কটি পেতে এবং আপনার সিস্টেমে সংরক্ষণাগারটি ডাউনলোড করতে অ্যাপাচি হাদুপ পৃষ্ঠাটি দেখুন।

# curl -O http://apache.javapipe.com/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz 

Account. অ্যাকাউন্টের হোম পাথের ডিরেক্টরিতে অনুলিপিটি অনুলিপি করে ডিরেক্টরি কন্টেন্ট করুন। এছাড়াও, নিশ্চিত হয়ে নিন যে আপনি সেই সাথে অনুলিপি করা ফাইলের অনুমতিগুলি পরিবর্তন করেছেন।

#  tar xfz hadoop-2.7.2.tar.gz
# cp -rf hadoop-2.7.2/* /opt/hadoop/
# chown -R hadoop:hadoop /opt/hadoop/

Next. এরপরে, হ্যাডোপ ব্যবহারকারীর সাথে লগইন করুন এবং .Bash_profile ফাইলটি সম্পাদনা করে আপনার সিস্টেমে হ্যাডোপ এবং জাভা এনভায়রনমেন্ট ভেরিয়েবলগুলি কনফিগার করুন।

# su - hadoop
$ vi .bash_profile

ফাইলের শেষে নিম্নলিখিত লাইনগুলি যুক্ত করুন:

## JAVA env variables
export JAVA_HOME=/usr/java/default
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar

## HADOOP env variables
export HADOOP_HOME=/opt/hadoop
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

৮. এখন, পরিবেশ পরিবর্তনশীল সূচনা করুন এবং নীচের আদেশগুলি জারি করে তাদের স্থিতি পরীক্ষা করুন:

$ source .bash_profile
$ echo $HADOOP_HOME
$ echo $JAVA_HOME

9. অবশেষে, নীচের কমান্ডগুলি চালনা করে হ্যাডোপ অ্যাকাউন্টের জন্য ssh কী ভিত্তিক প্রমাণীকরণ কনফিগার করুন (ততক্ষণে ssh-copy-id কমান্ডের সাথে হোস্টনাম বা FQDN প্রতিস্থাপন করুন)।

এছাড়াও, ssh এর মাধ্যমে স্বয়ংক্রিয়ভাবে লগইন করার জন্য পাসফ্রেজটি দায়ের করা ফাঁকা রেখে দিন।

$ ssh-keygen -t rsa
$ ssh-copy-id master.hadoop.lan