Advertisement
AZJIO

получить русский текст

Jan 25th, 2018
659
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
AutoIt 1.12 KB | None | 0 0
  1. #include <File.au3>
  2.  
  3. ; TXT
  4. $Path=@ScriptDir&'\html'
  5.  
  6. $FileList = _FileListToArray($Path, '*', 1)
  7. If @error Then
  8.     MsgBox(0, "", "ошибка поиска")
  9.     Exit
  10. EndIf
  11.  
  12. $RuTXT = ''
  13. For $i = 1 To $FileList[0]
  14.     $tmp = FileRead($Path & '\' & $FileList[$i])
  15.     $aTmp = StringRegExp($tmp, '[^A-Za-z0-9=&()+,''";\-\[\]:<>*.#@|/\r\n\t _~?{}%$^©\\][А-Яа-яЁё ?.,]+', 3)
  16.     If Not @error Then
  17.         $RuTxtFile = ''
  18.         For $j = 0 To UBound($aTmp) - 1
  19.             $RuTxtFile &= $aTmp[$j] & '.'
  20.         Next
  21.         ; $RuTXT&=$FileList[$i]&@CRLF&@CRLF&$RuTxtFile &@CRLF&@CRLF
  22.         $RuTXT &= $RuTxtFile & @CRLF & @CRLF
  23.     Else
  24.         ; $RuTXT&=' ----- '&$FileList[$i]&' - не найдено'&@CRLF&@CRLF
  25.     EndIf
  26. Next
  27.  
  28. ; пунктуационное приведение
  29. $RuTXT = StringReplace($RuTXT, ' .', '.')
  30. $RuTXT = StringRegExpReplace($RuTXT, '\.[ ]+', '. ')
  31. $RuTXT = StringRegExpReplace($RuTXT, '\.+', '.')
  32. $RuTXT = StringRegExpReplace($RuTXT, '\.(?![ t])', '. ')
  33.  
  34. ; исключения, сделать удаление
  35. $RuTXT = StringReplace($RuTXT, '1111', '')
  36.  
  37. $file = FileOpen(@ScriptDir & '\RuTXT.txt', 2)
  38. FileWrite($file, $RuTXT)
  39. FileClose($file)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement