mirror of
https://github.com/manualdousuario/marreta.git
synced 2026-04-29 03:50:21 +00:00
adiciona suporte a requisição via selenium gurizada
This commit is contained in:
parent
a6fc451f0a
commit
2b842a7cd6
10 changed files with 121 additions and 28 deletions
|
|
@ -22,6 +22,7 @@
|
|||
* 'scriptTagRemove' => ['gtm.js', 'ga.js'], // Exclui scripts específicos das regras globais
|
||||
* 'classElementRemove' => ['subscription'] // Exclui classes específicas das regras globais
|
||||
* ]
|
||||
* - useSelenium: Boolean indicando se deve usar Selenium para extração
|
||||
*/
|
||||
return [
|
||||
'nsctotal.com.br' => [
|
||||
|
|
@ -38,6 +39,14 @@ return [
|
|||
],
|
||||
'classAttrRemove' => ['wall', 'protected-content', 'cropped-block']
|
||||
],
|
||||
'gauchazh.clicrbs.com.br' => [
|
||||
'classAttrRemove' => [' m-paid-content', 'paid-content-apply'],
|
||||
'scriptTagRemove' => ['vendors-', 'verdors-'],
|
||||
'excludeGlobalRules' => [
|
||||
'classElementRemove' => ['paid-content']
|
||||
],
|
||||
'useSelenium' => true
|
||||
],
|
||||
'foreignaffairs.com' => [
|
||||
'customCode' => 'document.addEventListener(\'DOMContentLoaded\', function() {
|
||||
const dropcapDiv = document.querySelector(\'.article-dropcap\');
|
||||
|
|
|
|||
Loading…
Add table
Add a link
Reference in a new issue