python-docx is a Python library for creating and updating Microsoft Word (.docx) files.
🐱🔗 https://laravista.altervista.org/CatLink/links/295
#catlink #SoftwareLibrary #Python #DOCX #PythonDocx #Microsoft #Word #MicrosoftWord
python-docx is a Python library for creating and updating Microsoft Word (.docx) files.
🐱🔗 https://laravista.altervista.org/CatLink/links/295
#catlink #SoftwareLibrary #Python #DOCX #PythonDocx #Microsoft #Word #MicrosoftWord
Article by R. N. West on how to use #pandoc in an advanced way in order to generate corporate-styled Word documents.
The post explains custom styles, shows how #openxml templates can be used, and includes a short primer on important aspects of the #docx-format.
https://rnwest.engineer/auto-generate-docx-with-pandoc/
Jag skrev detta blogginlägg som uppföjning av rådfrågandet här på Mastodon. Tack alla för samtalet!
Det roligast ur min vinkel är bilden längst ner som visar hur det ser ut inne i en dokumentfil.
https://www.hemrin.com/business-blog/lite-om-digitala-dokumentformat
Тайны офиса: поиск скрытых метаданных в файлах DOCX, исправленных задним числом
Наверняка каждый из вас сталкивался с похожей ситуацией: ищешь вещь, уверен, что она лежит где-то рядом, а находишь совсем в другом месте. Как будто обронили винтик под ноги, а он взял и перекатился через всю комнату. В этом блоге я — Андрей Кравцов , специалист по реагированию на инциденты и цифровой криминалистике компании F6, — хочу рассказать о похожем опыте — поиске временных меток в файле с расширением DOCX. И поделюсь своим способом решения подобной задачи на примере воссозданной ситуации в виртуальной машине.
https://habr.com/ru/companies/F6/articles/889590/
#форензика #компьютерная_криминалистика #временные_метки #docx
Here is a blog post by Chris Maiorana about writing in #Emacs #orgmode and then figuring out how to export to #Docx. It is not the same solution that I came up with, but it handles multiple templates and options in a cool way. #writing https://chrismaiorana.com/from-emacs-to-microsoft-word/
Looking for a programmatic way to convert your PDFs into Docx? Then look no further than the {Convert2Docx} R package.
https://github.com/Ifeanyi55/Convert2Docx
It enables you to convert an entire PDF file or portions of it into a Word document in just a few lines of R code.
Have fun converting your documents! 😃
If you find it to be a helpful tool in your workflow, then please give the project a star 🌟. It will be very much appreciated 🙏
#rstats #python #software #pdf #docx #github #productivity #tool
Další vylepšení v kompatibilitě s docx - #LibreOffice nyní ignoruje horní okraj odstavce na jiných než prvních stránkách v novějších #DOCX
Detaily na blogu vývojáře z @CollaboraOffice https://vmiklos.hu/blog/sw-ignore-margin-page-top.html
Кошмар работы с *.docx файлами на Java посредством класса XWPFDocument из API Apache POI
Использование *.docx файлов как шаблонов для формирования кастомных отчётов с помощью библиотеки Apache POI XWPF на Java и связанные с этим проблемы. Примеры кода выполняющие простейшие операции поиска, замены, удаления элементов документа.
Wow, a British #ConTeXt user thanks with £100 for my “docx2ctx”* script that helped him finish a big project in time and that I slightly adapted to his needs.
AFAIR I never got paid for my open source contributions before. 🤑
*) https://codeberg.org/fiee/context-tools/src/branch/master/docx2ctx
Как я делала читалку форматов EPUB, FB2, DOCX для онлайн-библиотеки
Как-то раз я читала книгу на известном литературном портале и думала, какая же крутая у них читалка. Наверное, над её созданием трудится целая команда. В тот момент я даже не подозревала, что мне вскоре предстоит сделать что-то подобное. Расскажу, как я делала читалку для сайта библиотеки на заказ.
Well, I take back what I've said about Microsoft's OOXML format (used for MS Office files) being too complicated.
Generating a valid basic .docx file is pretty easy actually. All you need is document.xml file (+ two simple meta data files). The structure of document.xml is not much different than plain HTML.
You have a body tag, with paragraph tags. Each p tag has a format section, and a series if t tags of text fragments (called runs) with their own format section.
Dammit, the DocX format doesn't seem to distinguish between Page Break Before and Page Break After, unlike HTML (CSS) and Open Document does.
If you have a page break on an empty paragraph, it is always treated as a page break after, leaving the empty paragraph on the wrong page.
Since my editor is plain text, I have a [new page] code to add breaks, and they are always the Page Break Before kind, and can be applied to empty paragraphs.
Continuing with our image modification macros, we present an #ONLYOFFICE macro to easily modify images within #DOCX documents.
This simple macro will allow you to make adjustments like image resizing, cropping and more.
Read our blog to learn more: https://www.onlyoffice.com/blog/2024/10/how-to-scale-images-in-docx-documents-with-an-onlyoffice-macro
Hace años, abandoné Microsoft Word y me pasé a LibreOffice Writer. Aquí, reflexiono sobre mi experiencia de migración y cómo superé los obstáculos que surgieron. También repaso brevemente el origen de la "guerra de software de oficina" y sus consecuencias en la compatibilidad entre formatos de archivos de texto avanzado. #word #writer #microsoft #libreoffice #odt #docx #odb #biblatex
https://curriculum-261a13.gitlab.io/blog/2024/10/03/de-word-a-writer-la-batalla-del-software-de-oficina/
no comments🤦
#meme #linux #docx #libreoffice
🆕 pandoc 3.4
• New output format: ansi (for formatted console output).
• Command line options --table-caption-position and --figure-caption-position to place captions (in #HTML, #EPUB, #TeXLaTeX, #Docx, #ODT, #Typst)
• The default PDF engine for HTML is now #WeasyPrint
• --number-offsets works with docx output
And more
#pandoc
https://github.com/jgm/pandoc/releases/tag/3.4
Vous aviez des soucis pour afficher vos présentations et autres documents .docx .pptx sur LibreOffice ou autres suites bureautiques ?
Ne vous inquiétez pas, vous aurez aussi ces soucis dès 2025 avec Office 24 et Microsoft 365.
https://next.ink/brief_article/office-2024-desactivera-par-defaut-les-controles-activex/
[Suggestion]
Peut-être que le mieux serait d'abandonner ces formats de fichiers...
#Microsoft365 #Office2024 #LibreOffice #Docx #Pptx #Microsoft #ActiveX