GitHub - maiquelcraash/KeepCalm: Tweets miner service to populate the KeepCalm training database

Name	Name	Last commit message	Last commit date
Latest commit maiquelcraash Ajusted to use NB algorithm Jun 20, 2018 8a2b801 · Jun 20, 2018 History 42 Commits
.idea	.idea	Ajusted to user LR algorithm	Jun 5, 2018
KeepCalm Chrome Extension	KeepCalm Chrome Extension	Ajusted layout issues and classification parameters.	May 9, 2018
config	config	Ajusted to use NB algorithm	Jun 20, 2018
controller	controller	Ajusted to user LR algorithm	Jun 5, 2018
main-services	main-services	Ajusted to user LR algorithm	Jun 5, 2018
model	model	Created ActivityLog models and controllers. Now, each classification …	Mar 7, 2018
public	public	Added info to public html page.	Apr 9, 2018
res	res	Ajustes nas regras léxicas e sintáticas	Apr 24, 2018
test	test	Added feedback processor and learning mechanism.	Apr 20, 2018
.gitignore	.gitignore	Created properties file and a simple request manager using the twitte…	Jan 23, 2018
README.md	README.md	Ajusted production and development configs	Mar 13, 2018
package.json	package.json	Ajusted mongo remote options and start scripts.	Mar 14, 2018

Name

Last commit message

Last commit date

maiquelcraash

Ajusted to use NB algorithm

Jun 20, 2018

8a2b801 · Jun 20, 2018

42 Commits

.idea

Ajusted to user LR algorithm

Jun 5, 2018

KeepCalm Chrome Extension

Ajusted layout issues and classification parameters.

May 9, 2018

config

Ajusted to use NB algorithm

Jun 20, 2018

controller

Ajusted to user LR algorithm

Jun 5, 2018

main-services

Ajusted to user LR algorithm

Jun 5, 2018

model

Created ActivityLog models and controllers. Now, each classification …

Mar 7, 2018

public

Added info to public html page.

Apr 9, 2018

res

Ajustes nas regras léxicas e sintáticas

Apr 24, 2018

test

Added feedback processor and learning mechanism.

Apr 20, 2018

.gitignore

Created properties file and a simple request manager using the twitte…

Jan 23, 2018

README.md

Ajusted production and development configs

Mar 13, 2018

package.json

Ajusted mongo remote options and start scripts.

Mar 14, 2018

#KeepCalm Conjunto de serviços para a mineração a partir do Twitter, pré-processamento, armazenamento, treinamento e classificação de textos da internet.

Twitter API Documentation

https://developer.twitter.com/en/docs/tweets/search/api-reference/get-search-tweets.html

Natural Node API Documentation

https://github.com/NaturalNode/natural

Serviços

Todos os serviços podem ser localizados e iniciados a partir da pasta main-services/:

miner.js:
- Responsável por obter tweets com base em palavras-chave agressivas configuradas no arquivo config/properties.js
- O serviço também processa tweets não agressivos para fim de treinamento nos dois viéses
- Todos os dados são salvos na coleção rawTweets no mongodb
preProcessor.js:
- Responsável por retirar símbolos inúteis
- Padronizar o texto e remover palavras não relevantes (stop words)
- Extrair o radical das palavras (processo de steeming)
- Salvar dados processados na coleção posTweets no mongodb
classifier.js
- Responsável por treinar os algoritmos e classificar textos requeridos
- Cria um servidor que escutará na porta indicada no arquivo config/properties.js
server.js
- Responsável por tratar as requisções provenientes das extenções.
- Cria um servidor que escutará na porta indicada no arquivo config/properties.js

Informações adicionais

Deve-se iniciar o mongoDB previamente após configurar sua URL e porta no arquivo config/properties.js:
- $ mongod
Deve-se incluir mais memória ao V8 para rodar o algoritmo:
- $ node --max-old-space-size=4096 classifier.js
Para rodar no modo de teste (utiliza apenas 500 registros do banco)
- $ NODE_ENV=test node classifier.js

Conclusões Prévias

O método da regressão logística consome muito mais memória que o método de Bayes, pois precisa manter o campo amostral completo. Exito obtido apenas com uma limitação em 5 mil registros no treinamento e leva muitos minutos para treinar.

Agradecimentos

diegodorgam pelo PosTagger em português. https://github.com/diegodorgam/postagger

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Twitter API Documentation

Natural Node API Documentation

Serviços

Informações adicionais

Conclusões Prévias

Agradecimentos

About

Releases

Packages

Languages

maiquelcraash/KeepCalm

Folders and files

Latest commit

History

Repository files navigation

Twitter API Documentation

Natural Node API Documentation

Serviços

Informações adicionais

Conclusões Prévias

Agradecimentos

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages