From 6b5474e37890bf9fa03b3244d86965c7958cf922 Mon Sep 17 00:00:00 2001 From: ana Date: Fri, 24 Feb 2023 16:08:06 +0100 Subject: [PATCH] added Dutch stopwords --- summa/preprocessing/stopwords.py | 5 ++++- 1 file changed, 4 insertions(+), 1 deletion(-) diff --git a/summa/preprocessing/stopwords.py b/summa/preprocessing/stopwords.py index 3527d68..8fff2b6 100644 --- a/summa/preprocessing/stopwords.py +++ b/summa/preprocessing/stopwords.py @@ -191,6 +191,8 @@ arabic = """أنت كليكما اللتان بنا هما إذا اللواتي كم اللائي حيث ليستا هؤلاء بماذا ليت هيت بهم لهن التي لولا لو لهم هناك ثم سوف كيفما لستم لما ذينك بلى لا تلكم على لاسيما به بي اللذان أي ذه لن عل أو ريث أنتما """ +dutch = """de en van ik te dat die in een hij het niet zijn is was op aan met als voor had er maar om hem dan zou of wat mijn men dit zo door over ze zich bij ook tot je mij uit der daar haar naar heb hoe heeft hebben deze u want nog zal me zij nu ge geen omdat iets worden toch al waren veel meer doen toen moet ben zonder kan hun dus alles onder ja eens hier wie werd altijd doch wordt wezen kunnen ons zelf tegen na reeds wil kon niets uw iemand geweest andere""" + LANGUAGES = { "danish": danish, "english": english, @@ -200,7 +202,8 @@ LANGUAGES = { "swedish": swedish, "italian": italian, "polish": polish, - "arabic": arabic + "arabic": arabic, + "dutch": dutch }