From 4dc6f49e929c5409bc720f9e3c7df1b594b5005f Mon Sep 17 00:00:00 2001 From: Ali Hamdi Ali Fadel Date: Mon, 22 Jul 2024 16:51:49 +0000 Subject: [PATCH] Enhance Google Colab Notebook --- colab_notebook.ipynb | 143 ++++++++++++++++++++++++++++++------------- 1 file changed, 102 insertions(+), 41 deletions(-) diff --git a/colab_notebook.ipynb b/colab_notebook.ipynb index 2a2f5ec..994095d 100644 --- a/colab_notebook.ipynb +++ b/colab_notebook.ipynb @@ -1,42 +1,103 @@ { - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# @title

تحويل

\n", - "\n", - "print('جارٍ تجهيز بيئة العمل.')\n", - "\n", - "# Setup Tahweel.\n", - "!pip install -U tahweel==0.0.4 > install_logs.txt\n", - "\n", - "# Setup poppler-utils.\n", - "!apt-get install poppler-utils > poppler_logs.txt\n", - "\n", - "# Imports.\n", - "from google.colab.auth import authenticate_user\n", - "from google.colab.files import upload, download\n", - "\n", - "authenticate_user()\n", - "file_names = list(upload().keys())\n", - "\n", - "!tahweel . --dir-output-type side_by_side --docx-remove-newlines --service-account-credentials ./skip_service_account.json\n", - "\n", - "for file_name in file_names:\n", - " if file_name.endswith('.pdf'):\n", - " download(file_name.replace('.pdf', '.docx'))\n", - " download(file_name.replace('.pdf', '.txt'))" - ] - } - ], - "metadata": { - "language_info": { - "name": "python" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} + "cells": [ + { + "cell_type": "markdown", + "source": [ + "
\n", + "
\n", + "

تحويل - الكتب المُيسّرة

\n", + "
\n", + "\n", + "

مرحبًا بك في تحويل لتحويل ملفات PDF إلى Word/DOCX و TXT باستخدام تقنيات الذكاء الاصطناعي. لاستخدام تحويل:

\n", + "\n", + "
    \n", + "
  1. قم بتحديد ما إذا كنت تريد إزالة الأسطر من ملف Word/DOCX أو لا من خلال الخيار الموجود في الأسفل
  2. \n", + "
  3. قم بتشغيل الخلية في الأسفل من خلال الضغط على الدائرة المحتوية على السهم
  4. \n", + "
\n", + "\n", + "

عند الضغط على الدائرة المحتوية على السهم، ستبدأ عملية تجهيز بيئة العمل وستظهر لك رسالة تسألك هل تريد إعطاء الصلاحيات لتحويل أو لا، جاوب على هذه الرسالة بالموافقة واتبع الخطوات. بعد ذلك ستظهر لك رسالة تطلب منك اختيار ملف أو ملفات PDF التي تريد تحويلها إلى Word/DOCX و TXT. عند اختيار الملف أو الملفات، ستبدأ عملية التحويل وعند انتهائها سيتم تنزيل المخرجات إلى حاسبك.

\n", + "\n", + "
\n", + "\n", + "

يمكنك متابعة مشروع الكتب المُيسّرة والتواصل معنا من خلال:

\n", + "\n", + " \n", + "
" + ], + "metadata": { + "id": "7yt9XU3dWaLf" + } + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "cellView": "form", + "id": "6-aCYaB3PHis" + }, + "outputs": [], + "source": [ + "# @title

تحويل

\n", + "\n", + "print('جارٍ تجهيز بيئة العمل.')\n", + "\n", + "# Setup Tahweel.\n", + "!pip install -U tahweel==0.0.4 > install_logs.txt\n", + "\n", + "# Setup poppler-utils.\n", + "!apt-get install poppler-utils > poppler_logs.txt\n", + "\n", + "# Get inputs.\n", + "\n", + "# @markdown

إزالة الأسطر من ملفات Word/DOCX. هذا الاختيار مفيد في حال أردت أن تكون عدد صفحات ملف DOCX مساوياً لعدد صفحات ملف PDF.

\n", + "docx_remove_newlines = \"نعم\" # @param [\"نعم\", \"لا\"] {type:\"raw\"}\n", + "\n", + "# Imports.\n", + "import os\n", + "\n", + "from google.colab.auth import authenticate_user\n", + "from google.colab.files import upload, download\n", + "\n", + "if not os.path.exists('install_logs.txt'):\n", + " authenticate_user()\n", + "\n", + "file_names = list(upload().keys())\n", + "\n", + "print('جارٍ تحويل الملفات.')\n", + "\n", + "if docx_remove_newlines == \"نعم\":\n", + " os.system('tahweel . --dir-output-type side_by_side --docx-remove-newlines --service-account-credentials ./skip_service_account.json')\n", + "else:\n", + " os.system('tahweel . --dir-output-type side_by_side --service-account-credentials ./skip_service_account.json')\n", + "\n", + "print('جارٍ تنزيل المخرجات.')\n", + "\n", + "for file_name in file_names:\n", + " if file_name.endswith('.pdf'):\n", + " download(file_name.replace('.pdf', '.docx'))\n", + " download(file_name.replace('.pdf', '.txt'))" + ] + } + ], + "metadata": { + "language_info": { + "name": "python" + }, + "colab": { + "provenance": [] + }, + "kernelspec": { + "name": "python3", + "display_name": "Python 3" + } + }, + "nbformat": 4, + "nbformat_minor": 0 +} \ No newline at end of file