লিনাক্স টার্মিনালে মজা - শব্দ এবং অক্ষর গণনা সহ খেলুন
লিনাক্স কমান্ড লাইনটি নিজের চারপাশে অনেক মজা করে এবং অনেক ক্লান্তিকর কাজ নিখুঁততার সাথে খুব সহজেই সম্পাদন করা যায়। শব্দ এবং অক্ষরগুলির সাথে বাজানো, একটি পাঠ্য ফাইলে তাদের ফ্রিকোয়েন্সি ইত্যাদি আমরা এই নিবন্ধে দেখতে যাচ্ছি।
আমাদের মনে একমাত্র কমান্ডটি আসে, একটি টেক্সট ফাইল থেকে শব্দ এবং অক্ষরগুলি পরিচালনা করতে লিনাক্স কমান্ড লাইনটি টুইট করার জন্য ডাব্লুসি কমান্ড।
একটি শব্দের গণনা বোঝায় এমন একটি ‘ডাব্লুসি’ কমান্ড একটি পাঠ্য ফাইল থেকে নিউলাইন, শব্দ ও বাইট গণনা প্রিন্ট করতে সক্ষম।
পাঠ্য ফাইল বিশ্লেষণ করতে ছোট স্ক্রিপ্টগুলির সাথে কাজ করতে, আমাদের অবশ্যই একটি পাঠ্য ফাইল থাকা উচিত। অভিন্নতা বজায় রাখতে, আমরা নীচে বর্ণিত ম্যান কমান্ডের আউটপুট সহ একটি টেক্সট ফাইল তৈরি করছি।
$ man man > man.txt
উপরের কমান্ডটি ‘ম্যান’ কমান্ডের জন্য ‘ম্যানুয়াল পৃষ্ঠা’ এর সামগ্রী সহ একটি পাঠ্য ফাইল ‘man.txt’ তৈরি করে।
আমরা নীচের স্ক্রিপ্টটি চালিয়ে উপরের তৈরি ‘টেক্সট ফাইল’ -তে সর্বাধিক প্রচলিত শব্দগুলি পরীক্ষা করতে চাই।
$ cat man.txt | tr ' ' '2' | tr '[:upper:]' '[:lower:]' | tr -d '[:punct:]' | grep -v '[^a-z]' | sort | uniq -c | sort -rn | head
7557 262 the 163 to 112 is 112 a 78 of 78 manual 76 and 64 if 63 be
উপরের একটি লাইনারের সাধারণ স্ক্রিপ্টটি টেক্সট ফাইলে দশটি প্রায়শই প্রদর্শিত শব্দ এবং তাদের উপস্থিতির ফ্রিকোয়েন্সি দেখায়।
নিম্নলিখিত কমান্ডটি ব্যবহার করে কীভাবে কোনও শব্দকে পৃথক করে ফেলা যায়।
$ echo 'tecmint team' | fold -w1
t e c m i n t t e a m
দ্রষ্টব্য: এখানে, ‘-w1’ প্রস্থের জন্য।
এখন আমরা একটি টেক্সট ফাইলে প্রতিটি শব্দ ভেঙে ফেলা হবে, ফলাফলটি সাজান এবং দশটি ঘন অক্ষরের ফ্রিকোয়েন্সি সহ পছন্দসই আউটপুট পাব।
$ fold -w1 < man.txt | sort | uniq -c | sort -rn | head
8579 2413 e 1987 a 1875 t 1644 i 1553 n 1522 o 1514 s 1224 r 1021 l
বড় হাতের অক্ষর এবং ছোট হাতের অক্ষরগুলির সাথে টেক্সট ফাইলে সর্বাধিক ঘন ঘন অক্ষরগুলি কীভাবে পাওয়া যায় সেগুলি সম্পর্কে occ
$ fold -w1 < man.txt | sort | tr '[:lower:]' '[:upper:]' | uniq -c | sort -rn | head -20
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 o 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y 344 .
উপরের আউটপুটটি পরীক্ষা করুন, যেখানে বিরাম চিহ্ন অন্তর্ভুক্ত রয়েছে। ‘ট্র’ কমান্ডের সাহায্যে বিরামচিহ্নগুলি বের করতে দেয়। এখানে আমরা যাচ্ছি:
$ fold -w1 < man.txt | tr '[:lower:]' '[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -20
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1550 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y
এখন আমার কাছে তিনটি পাঠ্য ফাইল রয়েছে, আউটপুট দেখতে উপরের লাইন স্ক্রিপ্টটি চালাতে দিন।
$ cat *.txt | fold -w1 | tr '[:lower:]' '[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -8
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O
এরপরে আমরা কমপক্ষে দশটি বর্ণের লম্বা সেই অনাকাঙ্ক্ষিত বর্ণগুলি তৈরি করব। এখানে সরল লিপি দেওয়া আছে।
$ cat man.txt | tr '' '2' | tr '[:upper:]' '[:lower:]' | tr -d '[:punct:]' | tr -d '[0-9]' | sort | uniq -c | sort -n | grep -E '..................' | head
1 ────────────────────────────────────────── 1 a all 1 abc any or all arguments within are optional 1 able see setlocale for precise details 1 ab options delimited by cannot be used together 1 achieved by using the less environment variable 1 a child process returned a nonzero exit status 1 act as if this option was supplied using the name as a filename 1 activate local mode format and display local manual files 1 acute accent
দ্রষ্টব্য: সমস্ত ফলাফল উত্পন্ন না হওয়া পর্যন্ত উপরের স্ক্রিপ্টে আরও এবং আরও বেশি বিন্দু। দশটি চরিত্রের ম্যাচ পেতে আমরা ব্যবহার করতে পারি {10।।
এই সাধারণ স্ক্রিপ্টগুলিও আমাদের প্রায়শই প্রায়শই প্রদর্শিত ইংরেজী শব্দ এবং অক্ষরগুলি জানায়।
এখন এ পর্যন্তই. আমি এখানে আরও একটি আকর্ষণীয় এবং বীট প্রবন্ধটি জেনে রাখা উচিত, যা আপনারা পড়তে পছন্দ করবেন। নীচে মন্তব্য বিভাগে আপনার মূল্যবান প্রতিক্রিয়া আমাদের দিতে ভুলবেন না।
আরও পড়ুন: লিনাক্সের 20 মজার কমান্ড