TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

WEB 3.0

Tese: WEB 3.0. Pesquise 860.000+ trabalhos acadêmicos

Por:   •  6/5/2013  •  Tese  •  2.835 Palavras (12 Páginas)  •  461 Visualizações

Página 1 de 12

RESUMO

Resumo Este trabalho tem por objetivo descrever um projeto de Biblioteca Colaborativa Online que será desenvolvido para a UniPIM pela Web3.PIM. Ao longo deste estudo iremos especificar passo a passo o escopo do projeto, toda a modelagem do sistema, a infraestrutura de rede necessária, os atores envolvidos e os custos envolvidos nas etapas de planejamento, desenvolvimento e implantação. Também vamos destacar alguns riscos envolvidos e qual será o valor agregado pelo desenvolvimento deste projeto para a UniPIM e seus alunos.

ABSTRACT

Summary This paper aims to describe a Collaborative Online Library project than will be developed for the UniPIM by Web3.PIM. Throughout this study we specify step by step the project scope, the entire modeling system, the network infrastructure required, the actors involved and the costs involved in the planning, development and deployment. We will also highlight some risks involved and what is the value added by the development of this project to UniPIM and their students.

Sumário

RESUMO 3

ABSTRACT 4

Sumário 5

Introdução 6

Internet 3.0 7

Web 3.0 Experience 8

Escopo 9

Publicação de trabalhos 10

Área Administrativa - Carga de Dados para Busca Semântica 13

Dicionário de Tratamentos 14

Área Administrativa – Cadastros Diversos 18

Busca de Conteúdos 19

Diagrama de Atividades – Cadastro de informações e Busca de Conteúdos 21

Relatórios gerenciais 22

Infraestrutura 23

Riscos 25

Custos 26

Conclusão 27

Referências 28

Introdução

Nos últimos anos temos assistido diversas revoluções tecnológicas, cada qual trazendo um impacto nas nossas vidas cotidianas. Dentre várias mudanças, nenhuma mudou tantos comportamentos como a Internet, que carrega em si novas formas de enxergarmos o mundo que nos cerca e como nos relacionamos com as outras pessoas. Nunca a obtenção de informação foi tão rápida e fácil, bem como nunca foi tão simples comprar, se comunicar com outras pessoas, etc... Já nos seus primeiros anos de vida, a Internet dava sinais claros de que seria um grande instrumento de comunicação de massa, disputando com o rádio e a televisão o posto de principal mídia da humanidade. Com o passar dos anos, ocorreu uma revolução dentro da revolução. A Internet já havia se provado como fonte de pesquisa e mecanismo eficiente para consumo. Mas os usuários queriam mais, queriam eles mesmos dar sua contribuição para a revolução. As pessoas queriam se abrir para o mundo, compartilhar suas opiniões, seus conhecimentos e até mesmo as suas vidas. Surgiu assim a Internet 2.0, com seus blogs, suas redes de relacionamento, seus wikis, seus sites de vídeo e tantos outros. Todos eram bem-vindos, todo mundo estava convidado a dar sua contribuição. Como já era de se esperar, chegou o momento em que os internautas querem mais, muito mais. Já existe um volume de dados impressionante na Internet, disponível para quem quer que seja. Mas como organizar tanta informação? Como obter exatamente aquilo que se está buscando? Como dar para a máquina a coerência de uma resposta, algo que é uma qualidade exclusivamente racional e humana? A solução ainda não existe, mas a resposta para essa pergunta já tem nome: Internet 3.0.

Internet 3.0

O termo Internet 3.0 foi usado pela primeira vez em um artigo intitulado (pesquisar). Nele o autor defendia que o próximo desafio a ser enfrentado seria prover os softwares de busca de uma capacidade de buscar informações por semântica, e não exclusivamente por palavras como é feito hoje. Softwares de busca como o Google, o Yahoo e mais recentemente o Bing da Microsoft prestaram um serviço essencial aos usuários de diversas regiões do globo na difícil tarefa de localizar, dentre os milhões de páginas existentes no mundo todo, as informações específicas para as mais diversas necessidades. O problema é que o volume de dados se agigantou de tal maneira que uma simples pesquisa a respeito de determinado assunto pode consumir horas, não por falta de informação, mas por excesso. A busca de uma palavra chave no Google pode resultar em dezenas de milhões de resultados. Nesse cenário, fica muito difícil conseguir saber qual a informação mais adequada. Não existe consenso sobre quais serão as tecnologias necessárias para termos pesquisas tão inteligentes ao ponto de responder perguntas simples com respostas precisas. Mas a seguir iremos descrever um projeto que irá tentar chegar um pouco mais perto dessa realidade.

Web 3.0 Experience

O Web 3.0 Experience será um projeto voltado para a comunidade acadêmica da UniPIM, universidade de tecnologia com diversos campis distribuídos pelo país. Este projeto terá por objetivo criar um repositório de conteúdo acadêmico, através do qual os alunos e professores irão publicar trabalhos, artigos, pesquisas e outras informações que poderão ser utilizadas como fonte de pesquisa por outros membros da comunidade. Esta ferramenta será um software web utilizado como recurso de entrega de trabalhos de pesquisa, no qual as informações serão formatadas diretamente no ambiente online. Dessa forma, a base de dados acadêmica irá crescer rapidamente, servindo de repositório de consulta para os alunos da instituição. O grande diferencial do projeto Web 3.0 Experience vai ser a capacidade de busca de informações por semântica, onde o aluno poderá fazer perguntas do tipo “Onde está o Empire State?” e poderá receber respostas como “O Empire State ficava em Nova York, porém no dia 11/09/2001 sofreu um ataque...”. Responder perguntas de forma objetiva é uma tarefa complexa para qualquer ferramenta de busca, mas dentro de um ambiente com formatação de dados controlada como o Web 3.0 Experience, é possível atingir este objetivo, mesmo que parcialmente. Este projeto traz três grandes valores agregados: • A inserção dos membros da comunidade acadêmica da UniPIM no universo da Internet 3.0, familiarizando-os com esta nova tendência que deve tomar vulto nos próximos anos; • • A disponibilização de uma ferramenta colaborativa robusta para troca de conhecimento entre os alunos; A projeção da UniPIM não apenas como instituição de ensino de tecnologia, mas como centro de pesquisa e de vanguarda tecnológica, fazendo-a sobressair sobre suas concorrentes. Os detalhes técnicos e gerenciais desse projeto serão descritos a seguir.

Escopo

O escopo desse projeto é desenvolver uma ferramenta chamada Web 3.0 Experience, uma Biblioteca Colaborativa Virtual na qual alunos e professores poderão publicar trabalhos e conteúdos diversos. Estes conteúdos poderão ser trabalhos escolares que irão valer notas ou apenas artigos de divulgação de pesquisas dos membros da comunidade acadêmica. No caso de trabalhos valendo nota, os mesmos permanecerão ocultos até o término das fases de correções, só depois disso passando a estar visíveis para a comunidade. A ferramenta permitirá: Na área do aluno • • • • • • • • • • • • Formatação de textos; Inserção de imagens; Inserção de referências bibliográficas; Inserção de links de internet; Upload de anexos e materiais de apoio; Desenvolvimento colaborativo dos trabalhos, com diversos co-autores atuando sobre o mesmo projeto; Inclusão de comentários dos leitores; Assinatura dos leitores, para receberem alertas de revisões por email; Inclusão de tags (para buscas por palavra-chave); Busca por palavra-chave; Busca por semântica; Ferramenta de contato dos leitores com os autores das publicações.

Na área administrativa • • • Relatórios gerenciais; Ambiente de administração para cargas de dados de busca semântica; Acesso privilegiado para docentes, para correção de trabalhos que valem notas.

Publicação de trabalhos

Como falado anteriormente, a publicação de trabalhos e artigos poderá ser realizada individualmente ou em grupo, pois cada publicação irá contar com diversos co-autores. Cada trabalho publicado contará com textos formatados diretamente no ambiente online, poderá ser ilustrado com imagens e gráficos, e poderá ser enriquecido com referências bibliográficas, links e anexos. O criador do trabalho irá figurar como autor principal, ao qual caberá ajustar o status do trabalho como finalizado ou não, bem como disponibilizá-lo para a comunidade acadêmica. Também caberá ao autor principal definir se o trabalho valerá nota, nesse caso a publicação para o resto da comunidade estará condicionada à liberação por parte do professor.

Caso de Uso – Publicação de Trabalhos

«uses»

Inclusão de co-autores «uses»

«uses»

Alterações de Status «uses» Imagens «uses»

Professor

«uses»

«uses» Autor Principal Textos «uses»

Co-Autor

«uses»

«uses»

Links

«uses»

Anexos

Caso de Uso: Publicação de Trabalhos Atores: Autor Principal, Co-Autor e Professor Ação Inclusão de Textos Inclusão de Imagens Inclusão de Links Inclusão de Anexos Inclusão de Co-Autores Alteração de Status Ator Autor Principal e Co-Autor Autor Principal e Co-Autor Autor Principal e Co-Autor Autor Principal e Co-Autor Autor Principal Autor Principal e Professor

Área Administrativa - Carga de Dados para Busca Semântica

Para funcionamento da busca semântica, será necessário um intenso trabalho de cadastro de dados, para que a ferramenta tenha a inteligência necessária para fazer as buscas. Basicamente, será necessário fazer a carga dos dados dos tipos de pergunta, dicionário de sinônimos, flexões verbais, localidades, dicionário de nomes e dicionário de tratamentos.

Caso de Uso – Publicação de Trabalhos

Tipos de Pergunta

«uses»

Dicionário de Sinônimos

«uses»

Flexões Verbais «uses»

«uses» Operador Localidades

«uses»

Dicionário de Nomes «uses»

Dicionário de Tratamentos

Caso de Uso: Carga de dados para busca semântica Atores: Operador Ação Ator

Tipos de Pergunta Dicionário de Sinônimos Flexões Verbais Localidades Dicionário de Nomes Dicionário de Tratamentos

Operador Operador Operador Operador Operador Operador

Modelo de Dados

ConteudoBibliografia

idConteudoBibliografia idConteudo dsObra dsAutor dsEditora idPagina

CoA utor

idCoAutor idConteudo idUsuarioCoAutor

ConteudoTexto

idConteudoTexto idConteudo dsTexto idOrdem

ConteudoLink

idConteudoLink idConteudo dsLink dsTituloLink

Conteudo

idConteudo dsTitulo idTipoConteudo idUsuarioAutorPrincipal

idOrdem

TipoConteudo

idTipoConteudo dsTipoConteudo

Usuario

idUsuario dsUsuario

TipoPergunta

idTipoPergunta dsTipoPergunta bolLocalidade bolNome bolTratamento bolCidade bolEstado bolPais

Estado idMatricula

idEstado dsSenha dsEstado bolAdministrativo dsSigla

Palavra

idPalavra dsPalavra bolVerbo bolNome

Sinonimo

idSinonimo idPalavra idPalavraSinonimo

Cidade

idCidade dsCidade idEstado idPais

Pais

idPais dsPais

FlexaoVerbal

idFlexaoVerbal idPalavra dsPalavraFlexao

Localidade

idLocalidade dsLocalidade idCidade

Área Administrativa – Cadastros Diversos

O funcionamento do sistema vai depender de outros cadastros acessórios, necessários para viabilizar o funcionamento. São basicamente os cadastros de país, estado, cidade e tipos de conteúdo.

Caso de Uso – Cadastros Diversos

Cidade «uses»

Estado «uses»

Operador

«uses» País

«uses»

Tipo de Conteúdo

Caso de Uso: Cadastros diversos Atores: Operador Ação Cadastro de País Cadastro de Estado Cadastro de Cidade Cadastro de Tipos de Conteúdos Operador Operador Operador Operador Ator

Busca de Conteúdos

A busca de conteúdo será terá como critérios a pesquisa semântica e a pesquisa por palavra chave. A pesquisa por palavra chave usará recursos básicos de busca, utilizando apenas a cláusula “like” da linguagem SQL. A tela de consulta será composta basicamente por um campo de busca com um botão de envio. Neste campo de busca serão digitadas as palavras desejadas e a ferramenta irá buscar na base de dados trabalhos que tenham todas as palavras digitadas nos textos, títulos, links e referências bibliográficas. A busca por semântica irá fazer um trabalho mais complexo, pois tentará obter trabalhos que tenham respostas específicas para perguntas objetivas. Basicamente, alimentaremos a base de dados com diversos tipos de perguntas, usando os advérbios mais convencionais: “Quem”, “Quanto”, “Quando”, “Onde”, etc... Haverá orientações na tela avisando o aluno que as perguntas terão que ser objetivas, compostas de advérbio, verbo e complemento. De acordo com o advérbio utilizado, o sistema ire utilizar um algoritmo diferente, que terá seu comportamento pautado por regras específicas. Vamos destacar a seguir as principais considerações que serão feitas. Perguntas iniciadas por “Quem” normalmente são seguidas pelo verbo ser. Ex: “Quem é Barack Obama”, “Quem é Monteiro Lobato”, etc...O problema nesse caso é responder objetivamente quem eles foram. É provável encontrar textos onde esses nomes são citados, mas como encontrar o texto que fale quem eles foram? A resposta é seguir a mesma estrutura da pergunta, usando tabelas de equivalência. Não faz sentido tentar encontrar o nome de Monteiro Lobato em um texto se não buscarmos um tratamento acompanhando o nome, portanto a busca por “Quem” vai prescindir do nome do procurado + um tratamento do dicionário de tratamentos. Ex: “presidente”, “jogador de futebol”, “escritor”. Outro ponto fundamental: Para refinar a busca, podemos combinar a busca pelo nome de Monteiro Lobato precedendo o mesmo pelo verbo “ser”. Isso significa que o texto está qualificando Monteiro Lobato, o que aumenta a chance de resposta da nossa pergunta. Entretanto, dificilmente encontraremos Monteiro Lobato acompanhado do verbo ser no presente, dado que se trata de uma pessoa já falecida, portanto a busca pelo verbo ser tem que prever as diversas flexões verbais, por isso será necessário recorrer ao dicionário de flexões verbais. Outras palavras qualitativas da pergunta devem ser reaproveitadas. Se

perguntarmos “Quem construiu Brasília?”, o algoritmo irá usar o dicionário de sinônimos para buscar nomes acompanhados de palavras como “construir” e seus sinônimos, como “edificar”, “erguer”, etc... Basicamente, serão buscados textos combinando tratamentos, sinônimos de “construir” e o objeto principal da pesquisa, a palavra “Brasília”. Uma frase que atenderia nossa busca seria “o presidente Juscelino Kubitchek ergueu Brasília no planalto central ...”. Dessa forma, nossa busca seria satisfatoriamente bem sucedida. Da mesma forma, outras perguntas vão recorrer a consulta de elementos précadastrados para podermos refinar nossa busca. Perguntas iniciadas pela palavra “Onde” vão cruzar informações com o objeto de pesquisa com cidades, estados e países pré-cadastrados. Ex: Onde fica a Torre Eiffel? Vamos buscar o objeto da pesquisa – no caso “Torre Eiffel” combinado a localidades cadastradas, pois não nos interessam informações da Torre Eiffel que não estejam combinadas com elementos de localização, além de sinônimos de “ficar”. Portanto, uma frase como “a Torre Eiffel está localizada em Paris” estaria dentro dos nossos parâmetros de pesquisa. Entretanto, vale ressaltar que a palavra “Paris” teria que estar cadastrada na nossa lista de cidades, o que dá a dimensão do esforço de carga de dados que será necessário. Provavelmente serão meses alimentando o sistema com informações diversas.

Diagrama de Atividades – Cadastro de informações e Busca de Conteúdos

Operador

Usuário

Seleciona o tipo de pesquisa

[Pesquisa por palavra chave?]

[Pesquisa por semântica?]

Digita a palavra-chave

Digita a pergunta desejada

Cadastro de informações de apoio

Artefato executa o algoritmo adequado

Sistema retorna lista de trabalhos que atendem a consulta

Usuário acessa o trabalho na íntegra

Relatórios gerenciais

Através da área administrativa será possível ver estatísticas das perguntas mais realizadas. Assim, a partir dessas informações será possível determinar quais palavras que precisam ser cadastradas na base de dados para auxiliar em pesquisas futuras. Também será possível determinar quantos usuários estão acessando o sistema, total de pesquisas realizadas, total de trabalhos publicados, conteúdos mais vistos, etc...

«uses»

Relatórios gerenciais

Administrador

Caso de Uso: Relatórios gerenciais Atores: Administrador Ação Filtra os dados de acordo com a necessidade Ator Administrador

Infraestrutura

Para atender esse projeto serão criados centros de pesquisa chamados Web 3.0 Experience Room. Serão salas com 4 computadores ligados em rede que se conectarão ao site Web 3.0 Experience para que qualquer membro da comunidade possa realizar pesquisas ou inserir trabalhos e artigos. Basicamente, esses computadores estarão ligados a um switch nível 2, que por sua vez estará ligado à rede do Campi. Essa conta com um servidor Proxy que controla o acesso a Internet e irá direcionar as requisições dos alunos a aplicação Server side que estará instalada em um datacenter em São Paulo. A arquitetura será basicamente a seguinte:

Servidor de banco de dados

Firewall

Servidor de aplicação Proxy

20

Cada campi terá sua rede que possuirá uma identificação distinta. Assim, um campi terá uma rede iniciada em 192.168.0, outro em 19.168.1, e assim por diante, cabendo ao último conjunto de números a identificação do computador e todas as redes utilizarão a máscara de sub-rede 255.255.255.0. Quanto aos servidores, os mesmos deverão possuir grande capacidade de processamento, sobretudo o servidor de banco de dados, que precisará cruzar vários dados a cada pesquisa, tentando entretanto manter a performance da aplicação.

21

Riscos

Em virtude da grande visibilidade que o assunto Web 3.0 está tendo e vai ter cada vez mais nos próximos anos, é de se esperar que o projeto da UniPIM se transforme numa grande vitrine para mostrar a instituição como potencial centro de pesquisa de tecnologia da informação. Portanto, o risco de que informações sigilosas / estratégicas sejam vendidas para concorrentes ou “vazadas” na Internet sempre existe e precisa ser previsto. Para tanto, podem ser tomadas algumas medidas: • • • Restrição do acesso de usuários ao servidor no qual estão armazenados os documentos referentes ao projeto; Desativação de envio de anexos em emails, portas USBs, gravadores de CDs e DVDs e outros meios que permitam transporte de dados; Registro do projeto e das tecnologias que serão pesquisadas no INPI – Instituto Nacional de Propriedade Industrial; Após o término do projeto as informações poderão ser disponibilizadas para o grande público em forma de case de sucesso de desenvolvimento de sistemas.

Custos

O projeto todo irá envolver diversos profissionais, nas fases de planejamento, execução, implantação e também na carga dos dados necessários para o funcionamento. Eis abaixo uma estimativa de custo dos profissionais envolvidos:

Total de Profissional Gerente de projetos Analista de sistemas Desenvolvedor Tester Digitador Profissional de infraestrutura Total de Horas Valor/hora Meses Profissionais 800 320 960 320 2400 80 R$ 50,00 R$ 32,00 R$ 28,00 R$ 20,00 R$ 10,00 R$ 32,00 5 1 3 1 3 0,5 1 2 2 2 5 1 Custo R$ 40.000,00 R$ 10.240,00 R$ 26.880,00 R$ 6.400,00 R$ 24.000,00 R$ 2.560,00

Custo Total -----> R$ 110.080,00

Conclusão

Apesar da complexidade inerente a um projeto desta espécie, vimos que é possível desenvolver uma ferramenta que se alinhe aos conceitos de Web 3.0 dentro de uma escala reduzida. Chama a atenção a complexidade do assunto, mesmo quando estamos restringindo o tipo de pesquisa que pode ser realizada. Aqui temos uma perspectiva do tamanho do desafio que temos pela frente. Obviamente esta solução não se aplicaria aos grandes buscadores de dados como o Google ou o BING, que trabalham com informações infinitamente mais diversificadas e sem seguir nenhum padrão específico. Mas serve como um ensaio para uma tendência que irá ganhar força nos próximos anos e que similar a revoluções anteriores irá mudar nossa forma de nos relacionarmos com a Internet e a incalculável quantidade de informações que ela tem a nos oferecer.

Referências

Wikipedia, a enciclopédia livre - http://pt.wikipedia.org The Mail Archive - http://www.mail-archive.com/bib_virtual@ibict.br/msg01199.html

Info Wester - http://www.infowester.com Paulo Afonso Pereira Propriedade Intelectual - http://www.pap.com.br/

...

Baixar como  txt (20.7 Kb)  
Continuar por mais 11 páginas »