Propuesta de Proyecto de Minería de Big Data
Forfatter
Kiara Lucas
Sidst opdateret
9 år siden
Licens
Creative Commons CC BY 4.0
Resumé
Proyecto: Amazon.com
Proyecto: Amazon.com
\documentclass[10pt, oneside,spanish]{article} % use "amsart" instead of "article" for AMSLaTeX format
\usepackage{geometry} % See geometry.pdf to learn the layout options. There are lots.
\geometry{a4paper} % ... or a4paper or a5paper or ...
\usepackage[spanish, es-noindentfirst]{babel}
\selectlanguage{spanish}
\usepackage[utf8]{inputenc}
%\geometry{landscape} % Activate for rotated page geometry
%\usepackage[parfill]{parskip} % Activate to begin paragraphs with an empty line rather than an indent
\usepackage{graphicx} % Use pdf, png, jpg, or eps§ with pdflatex; use eps in DVI mode
% TeX will automatically convert eps --> pdf in pdflatex
\usepackage{amssymb}
\usepackage{authblk}
%SetFonts
%SetFonts
\title{Propuesta de Proyecto de Minería de Big Data}
\author[1]{Ana Barbosa Vargas}
\author[1]{Kiara Lucas Herrera}
\affil[ ]{Carrera de Ingeniería en Sistemas Computacionales}
\affil[ ]{Universidad de Guayaquil}
\affil[ ]{}
\affil[ ]{PROYECTO: AMAZON}
\renewcommand\Authands{, }
\date{} % Activate to display a given date or no date
\begin{document}
\maketitle
\section{Definición del problema de investigación}
Actualmente las redes mundiales de información están transformando al mundo y acercando más a la gente a través de la innovación de las comunicaciones, lo cual posibilita cambios en todos los ámbitos de la actividad humana dando como resultado al nuevo mundo llamado "Comercio Electrónico".
El comercio electrónico, también conocido como e-commerce (electronic commerce), consiste en la compra y venta de productos o de servicios a través de medios electrónicos, tales como Internet y otras redes informáticas.
Por tal motivo como propuesta de proyecto hemos escogido el Sitio Web de \textbf{Amazon.com}, ya que ésta compañía se dedica al comercio electrónico y servicios de computación en la nube.
Este tema de proyecto es importante e interesante porque realizaremos el siguiente análisis:
\begin{itemize}
\item ¿Cómo encontrar artículos similares?
\item ¿Cuál es el conjunto de elementos frecuentes?
\end{itemize}
\begin{itemize}
\item ¿Cuál es la clasificación jerárquica de productos?
\end{itemize}
\section{Datos}
Los datos que utilizaremos para resolver la problemática detallada en el punto anterior lo realizaremos accediendo al sitio web de dicha compañía; por medio del cual implementaremos los métodos para recolectar información \textbf{crawling/scraping}. Los mismos que nos ayudarán a obtener los datos que se encuentran dentro del código HTML.
\begin{figure}
\centering
\includegraphics[width=0.5\textwidth]{amazon_logo_RGB.jpg}
\end{figure}
Este paso puede tomar una cantidad considerable de tiempo si no se es cuidadoso; por tal motivo simplificaremos la tarea enfocándonos en un subconjunto de datos o usando un conjunto de datos ya existente.
\section{Metodología}
¿Cómo se resolverá el problema?
\begin{itemize}
\item Resolveremos el problema identificando el área de investigación con las herramientas de aprendizaje que han sido y seguirán siendo proporcionadas en clases.
\item Buscando información en sitios de fuentes confiables como lo es el sitio web de dicha compañía en estudio https://aws.amazon.com/es/datasets/.
\end{itemize}
\begin{itemize}
\item Investigar información de artículos relacionados al comercio electrónico en scholar.google.com.
\end{itemize}
\section{Evaluación de metodología}
De acuerdo a la metodología establecida lograremos saber si fué exitoso nuestro experimento ya que nos concetraremos en un conjunto de datos pequeños para poder determinar la categorización de productos más vendidos; por lo cual la métrica de evaluación será "Determinar" el conjunto de elementos \textbf{frecuentes} que tienen mayor acogida en el comercio de ésta compañía.
\section{Resultados esperados}
Los resultados esperados se encuentran detallados en todo el contenido de la presente propuesta de proyecto, adicional los entregables de todo el proceso que conlleve el experimento de la extracción de los datos del sitio web de "AMAZON" serán expuestos al momento de la calificación del mismo.
\end{document}