লিনাক্স টার্মিনালে মজা - শব্দ এবং অক্ষর গণনা সহ খেলুন


লিনাক্স কমান্ড লাইনটি নিজের চারপাশে অনেক মজা করে এবং অনেক ক্লান্তিকর কাজ নিখুঁততার সাথে খুব সহজেই সম্পাদন করা যায়। শব্দ এবং অক্ষরগুলির সাথে বাজানো, একটি পাঠ্য ফাইলে তাদের ফ্রিকোয়েন্সি ইত্যাদি আমরা এই নিবন্ধে দেখতে যাচ্ছি।

আমাদের মনে একমাত্র কমান্ডটি আসে, একটি টেক্সট ফাইল থেকে শব্দ এবং অক্ষরগুলি পরিচালনা করতে লিনাক্স কমান্ড লাইনটি টুইট করার জন্য ডাব্লুসি কমান্ড।

একটি শব্দের গণনা বোঝায় এমন একটি ‘ডাব্লুসি’ কমান্ড একটি পাঠ্য ফাইল থেকে নিউলাইন, শব্দ ও বাইট গণনা প্রিন্ট করতে সক্ষম।

পাঠ্য ফাইল বিশ্লেষণ করতে ছোট স্ক্রিপ্টগুলির সাথে কাজ করতে, আমাদের অবশ্যই একটি পাঠ্য ফাইল থাকা উচিত। অভিন্নতা বজায় রাখতে, আমরা নীচে বর্ণিত ম্যান কমান্ডের আউটপুট সহ একটি টেক্সট ফাইল তৈরি করছি।

$ man man > man.txt

উপরের কমান্ডটি ‘ম্যান’ কমান্ডের জন্য ‘ম্যানুয়াল পৃষ্ঠা’ এর সামগ্রী সহ একটি পাঠ্য ফাইল ‘man.txt’ তৈরি করে।

আমরা নীচের স্ক্রিপ্টটি চালিয়ে উপরের তৈরি ‘টেক্সট ফাইল’ -তে সর্বাধিক প্রচলিত শব্দগুলি পরীক্ষা করতে চাই।

$ cat man.txt | tr ' '  '2' | tr '[:upper:]' '[:lower:]' | tr -d '[:punct:]' | grep -v '[^a-z]' | sort | uniq -c | sort -rn | head
7557 
262 the 
163 to 
112 is 
112 a 
78 of 
78 manual 
76 and 
64 if 
63 be

উপরের একটি লাইনারের সাধারণ স্ক্রিপ্টটি টেক্সট ফাইলে দশটি প্রায়শই প্রদর্শিত শব্দ এবং তাদের উপস্থিতির ফ্রিকোয়েন্সি দেখায়।

নিম্নলিখিত কমান্ডটি ব্যবহার করে কীভাবে কোনও শব্দকে পৃথক করে ফেলা যায়।

$ echo 'tecmint team' | fold -w1
t 
e 
c 
m 
i 
n 
t 
t 
e 
a 
m

দ্রষ্টব্য: এখানে, ‘-w1’ প্রস্থের জন্য।

এখন আমরা একটি টেক্সট ফাইলে প্রতিটি শব্দ ভেঙে ফেলা হবে, ফলাফলটি সাজান এবং দশটি ঘন অক্ষরের ফ্রিকোয়েন্সি সহ পছন্দসই আউটপুট পাব।

$ fold -w1 < man.txt | sort | uniq -c | sort -rn | head
8579  
2413 e
1987 a
1875 t
1644 i
1553 n
1522 o
1514 s
1224 r
1021 l

বড় হাতের অক্ষর এবং ছোট হাতের অক্ষরগুলির সাথে টেক্সট ফাইলে সর্বাধিক ঘন ঘন অক্ষরগুলি কীভাবে পাওয়া যায় সেগুলি সম্পর্কে occ

$ fold -w1 < man.txt | sort | tr '[:lower:]' '[:upper:]' | uniq -c | sort -rn | head -20
11636  
2504 E 
2079 A 
2005 T 
1729 I 
1645 N 
1632 S 
1580 o
1269 R 
1055 L 
836 H 
791 P 
766 D 
753 C 
725 M 
690 U 
605 F 
504 G 
352 Y 
344 .

উপরের আউটপুটটি পরীক্ষা করুন, যেখানে বিরাম চিহ্ন অন্তর্ভুক্ত রয়েছে। ‘ট্র’ কমান্ডের সাহায্যে বিরামচিহ্নগুলি বের করতে দেয়। এখানে আমরা যাচ্ছি:

$ fold -w1 < man.txt | tr '[:lower:]' '[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -20
  11636  
  2504 E 
  2079 A 
  2005 T 
  1729 I 
  1645 N 
  1632 S 
  1580 O 
  1550 
  1269 R 
  1055 L 
   836 H 
   791 P 
   766 D 
   753 C 
   725 M 
   690 U 
   605 F 
   504 G 
   352 Y

এখন আমার কাছে তিনটি পাঠ্য ফাইল রয়েছে, আউটপুট দেখতে উপরের লাইন স্ক্রিপ্টটি চালাতে দিন।

$ cat *.txt | fold -w1 | tr '[:lower:]' '[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -8
  11636  
   2504 E 
   2079 A 
   2005 T 
   1729 I 
   1645 N 
   1632 S 
   1580 O

এরপরে আমরা কমপক্ষে দশটি বর্ণের লম্বা সেই অনাকাঙ্ক্ষিত বর্ণগুলি তৈরি করব। এখানে সরল লিপি দেওয়া আছে।

$ cat man.txt | tr '' '2' | tr '[:upper:]' '[:lower:]' | tr -d '[:punct:]' | tr -d '[0-9]' | sort | uniq -c | sort -n |  grep -E '..................' | head
1        ────────────────────────────────────────── 
1        a all 
1        abc             any or all arguments within   are optional 
1               able  see setlocale for precise details 
1        ab              options delimited by  cannot be used together 
1               achieved by using the less environment variable 
1              a child process returned a nonzero exit status 
1               act as if this option was supplied using the name as a filename 
1               activate local mode  format and display  local  manual  files 
1               acute accent

দ্রষ্টব্য: সমস্ত ফলাফল উত্পন্ন না হওয়া পর্যন্ত উপরের স্ক্রিপ্টে আরও এবং আরও বেশি বিন্দু। দশটি চরিত্রের ম্যাচ পেতে আমরা ব্যবহার করতে পারি {10।।

এই সাধারণ স্ক্রিপ্টগুলিও আমাদের প্রায়শই প্রায়শই প্রদর্শিত ইংরেজী শব্দ এবং অক্ষরগুলি জানায়।

এখন এ পর্যন্তই. আমি এখানে আরও একটি আকর্ষণীয় এবং বীট প্রবন্ধটি জেনে রাখা উচিত, যা আপনারা পড়তে পছন্দ করবেন। নীচে মন্তব্য বিভাগে আপনার মূল্যবান প্রতিক্রিয়া আমাদের দিতে ভুলবেন না।

আরও পড়ুন: লিনাক্সের 20 মজার কমান্ড