-
Notifications
You must be signed in to change notification settings - Fork 0
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Showing
1 changed file
with
102 additions
and
41 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,42 +1,103 @@ | ||
{ | ||
"cells": [ | ||
{ | ||
"cell_type": "code", | ||
"execution_count": null, | ||
"metadata": {}, | ||
"outputs": [], | ||
"source": [ | ||
"# @title <h1><center>تحويل</center></h1>\n", | ||
"\n", | ||
"print('جارٍ تجهيز بيئة العمل.')\n", | ||
"\n", | ||
"# Setup Tahweel.\n", | ||
"!pip install -U tahweel==0.0.4 > install_logs.txt\n", | ||
"\n", | ||
"# Setup poppler-utils.\n", | ||
"!apt-get install poppler-utils > poppler_logs.txt\n", | ||
"\n", | ||
"# Imports.\n", | ||
"from google.colab.auth import authenticate_user\n", | ||
"from google.colab.files import upload, download\n", | ||
"\n", | ||
"authenticate_user()\n", | ||
"file_names = list(upload().keys())\n", | ||
"\n", | ||
"!tahweel . --dir-output-type side_by_side --docx-remove-newlines --service-account-credentials ./skip_service_account.json\n", | ||
"\n", | ||
"for file_name in file_names:\n", | ||
" if file_name.endswith('.pdf'):\n", | ||
" download(file_name.replace('.pdf', '.docx'))\n", | ||
" download(file_name.replace('.pdf', '.txt'))" | ||
] | ||
} | ||
], | ||
"metadata": { | ||
"language_info": { | ||
"name": "python" | ||
} | ||
}, | ||
"nbformat": 4, | ||
"nbformat_minor": 2 | ||
} | ||
"cells": [ | ||
{ | ||
"cell_type": "markdown", | ||
"source": [ | ||
"<div dir=\"rtl\">\n", | ||
" <center>\n", | ||
" <h1>تحويل - الكتب المُيسّرة</h1>\n", | ||
" </center>\n", | ||
"\n", | ||
" <p>مرحبًا بك في تحويل لتحويل ملفات PDF إلى Word/DOCX و TXT باستخدام تقنيات الذكاء الاصطناعي. لاستخدام تحويل:</p>\n", | ||
"\n", | ||
" <ol>\n", | ||
" <li>قم بتحديد ما إذا كنت تريد إزالة الأسطر من ملف Word/DOCX أو لا من خلال الخيار الموجود في الأسفل</li>\n", | ||
" <li>قم بتشغيل الخلية في الأسفل من خلال الضغط على الدائرة المحتوية على السهم</li>\n", | ||
" </ol>\n", | ||
"\n", | ||
" <p>عند الضغط على الدائرة المحتوية على السهم، ستبدأ عملية تجهيز بيئة العمل وستظهر لك رسالة تسألك هل تريد إعطاء الصلاحيات لتحويل أو لا، جاوب على هذه الرسالة بالموافقة واتبع الخطوات. بعد ذلك ستظهر لك رسالة تطلب منك اختيار ملف أو ملفات PDF التي تريد تحويلها إلى Word/DOCX و TXT. عند اختيار الملف أو الملفات، ستبدأ عملية التحويل وعند انتهائها سيتم تنزيل المخرجات إلى حاسبك.</p>\n", | ||
"\n", | ||
" <hr>\n", | ||
"\n", | ||
" <p>يمكنك متابعة مشروع <strong>الكتب المُيسّرة</strong> والتواصل معنا من خلال:</p>\n", | ||
"\n", | ||
" <ul>\n", | ||
" <li><a href=\"https://t.me/ieasybooks\">قناتنا على تيليجرام</a></li>\n", | ||
" <li><a href=\"https://www.youtube.com/@ieasybooks\">قناتنا على يوتيوب</a></li>\n", | ||
" <li><a href=\"https://twitter.com/iieasybooks\">حسابنا على تويتر</a></li>\n", | ||
" <li><a href=\"https://www.facebook.com/ieasybooks\">صفحتنا على فيسبوك</a></li>\n", | ||
" <li><a href=\"https://github.com/ieasybooks\">حسابنا على GitHub (للمبرمجين)</a></li>\n", | ||
" <li>بريدنا الالكتروني: [email protected]</li>\n", | ||
" </ul>\n", | ||
"</div>" | ||
], | ||
"metadata": { | ||
"id": "7yt9XU3dWaLf" | ||
} | ||
}, | ||
{ | ||
"cell_type": "code", | ||
"execution_count": null, | ||
"metadata": { | ||
"cellView": "form", | ||
"id": "6-aCYaB3PHis" | ||
}, | ||
"outputs": [], | ||
"source": [ | ||
"# @title <h1><center>تحويل</center></h1>\n", | ||
"\n", | ||
"print('جارٍ تجهيز بيئة العمل.')\n", | ||
"\n", | ||
"# Setup Tahweel.\n", | ||
"!pip install -U tahweel==0.0.4 > install_logs.txt\n", | ||
"\n", | ||
"# Setup poppler-utils.\n", | ||
"!apt-get install poppler-utils > poppler_logs.txt\n", | ||
"\n", | ||
"# Get inputs.\n", | ||
"\n", | ||
"# @markdown <p dir=\"rtl\">إزالة الأسطر من ملفات Word/DOCX. هذا الاختيار مفيد في حال أردت أن تكون عدد صفحات ملف DOCX مساوياً لعدد صفحات ملف PDF.</p>\n", | ||
"docx_remove_newlines = \"نعم\" # @param [\"نعم\", \"لا\"] {type:\"raw\"}\n", | ||
"\n", | ||
"# Imports.\n", | ||
"import os\n", | ||
"\n", | ||
"from google.colab.auth import authenticate_user\n", | ||
"from google.colab.files import upload, download\n", | ||
"\n", | ||
"if not os.path.exists('install_logs.txt'):\n", | ||
" authenticate_user()\n", | ||
"\n", | ||
"file_names = list(upload().keys())\n", | ||
"\n", | ||
"print('جارٍ تحويل الملفات.')\n", | ||
"\n", | ||
"if docx_remove_newlines == \"نعم\":\n", | ||
" os.system('tahweel . --dir-output-type side_by_side --docx-remove-newlines --service-account-credentials ./skip_service_account.json')\n", | ||
"else:\n", | ||
" os.system('tahweel . --dir-output-type side_by_side --service-account-credentials ./skip_service_account.json')\n", | ||
"\n", | ||
"print('جارٍ تنزيل المخرجات.')\n", | ||
"\n", | ||
"for file_name in file_names:\n", | ||
" if file_name.endswith('.pdf'):\n", | ||
" download(file_name.replace('.pdf', '.docx'))\n", | ||
" download(file_name.replace('.pdf', '.txt'))" | ||
] | ||
} | ||
], | ||
"metadata": { | ||
"language_info": { | ||
"name": "python" | ||
}, | ||
"colab": { | ||
"provenance": [] | ||
}, | ||
"kernelspec": { | ||
"name": "python3", | ||
"display_name": "Python 3" | ||
} | ||
}, | ||
"nbformat": 4, | ||
"nbformat_minor": 0 | ||
} |