Commit 0a5d3c0f authored by Ernesto Crespo's avatar Ernesto Crespo

Artículo de pyspark contador de palabras

parent 87d040d1
1942: La Declaración de las Naciones Unidas
Representantes de 26 Estados que lucharon contra las potencias del Eje Roma-Berlín-Tokio manifestaron su apoyo a la Carta del Atlántico mediante su firma de la « Declaración de las Naciones Unidas ». En este trascendental documento, los signatarios se comprometían a poner su máximo empeño en la guerra y a no firmar una paz por separado.
Declaración de las Naciones Unidas prometiendo "emplear todos sus recursos, militares o económicos" en "la lucha por la victoria sobre el hitlerismo".
El día de año nuevo de 1942, el señor presidente Roosevelt y los señores Winston Churchill, Maxim Litvinov, de la Unión Soviética, y T. V. Soong, de China, firmaron un breve documento que luego se conocería como la Declaración de las Naciones Unidas. Al día siguiente se sumaron los representantes de otras 22 naciones más. En este trascendental documento, los signatarios se comprometían a poner su máximo empeño en la guerra y a no firmar una paz por separado.
La Declaración de las Naciones Unidas
La alianza completa a que se llegó en esta forma concordaba con los principios enunciados en la Carta del Atlántico, y la primera cláusula de la declaración de las Naciones Unidas reza que los países signatarios
« . . . han suscrito un programa común de propósitos y principios enunciados en la declaración conjunta del presidente de los Estados Unidos de América y del primer ministro del Reino Unido de la Gran Bretaña e Irlanda del Norte, fechada el 14 de agosto de 1941, y conocida como la Carta del Atlántico. ».
Cuando tres años después se iniciaban los preparativos para la conferencia de San Francisco, únicamente se invitó a participar a aquellos estados que, en marzo de 1945, habían declarado la guerra a Alemania y al Japón y que habían firmado la Declaración de las Naciones Unidas.
Signatarios Originales de la Declaración de la ONU
Los 26 signatarios originales fueron: Los Estados Unidos de América, el Reino Unido de la Gran Bretaña e Irlanda del Norte, la Unión de Repúblicas Socialistas Soviéticas, China, Australia, Bélgica, Canadá, Costa Rica, Checoeslovaquia, El Salvador, Grecia, Guatemala, Haití, Honduras, India, Luxemburgo, Nicaragua, Noruega, Nueva Zelandia, Países Bajos, Panamá, Polonia, República Dominicana, Unión Sudafricana, Yugoeslavia .
Los firmantes posteriores
Más tarde se adhirieron a la Declaración los siguientes países (en el orden de las firmas): México, Colombia, Iraq, Irán, Liberia, Paraguay, Chile, Uruguay, Egipto, Siria, Francia, Filipinas, Brasil, Bolivia, Etiopía, Ecuador, Perú, Venezuela, Turquía, Arabia Saudita, Líbano.
{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"#Se importa SparkContext y SparkConf\n",
"from pyspark import SparkContext, SparkConf"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"#Se crea la instancia de la configuración con el nombre de la aplicación contador\n",
"conf1 = SparkConf().setAppName(\"contador\").setMaster(\"local[3]\")"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [],
"source": [
"#Se crea el contexto pasando la instancia de la configuración\n",
"sc = SparkContext(conf = conf1)"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [],
"source": [
"#Se extrae las líneas del texto \n",
"lineas = sc.textFile(\"data/declaracion_onut.text\")"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [],
"source": [
"#Se extrae las palabras del texto y se cuentan\n",
"contarPalabras = lineas.flatMap(lambda linea: linea.split(\" \")).countByValue()"
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"1942: : 1\n",
"La : 3\n",
"Declaración : 8\n",
"de : 29\n",
"las : 9\n",
"Naciones : 7\n",
"Unidas : 5\n",
"Representantes : 1\n",
"26 : 2\n",
"Estados : 3\n",
"que : 5\n",
"lucharon : 1\n",
"contra : 1\n",
"potencias : 1\n",
"del : 9\n",
"Eje : 1\n",
"Roma-Berlín-Tokio : 1\n",
"manifestaron : 1\n",
"su : 4\n",
"apoyo : 1\n",
"a : 10\n",
"la : 21\n",
"Carta : 3\n",
"Atlántico : 1\n",
"mediante : 1\n",
"firma : 1\n",
"« : 2\n",
"». : 2\n",
"En : 2\n",
"este : 2\n",
"trascendental : 2\n",
"documento, : 2\n",
"los : 9\n",
"signatarios : 4\n",
"se : 8\n",
"comprometían : 2\n",
"poner : 2\n",
"máximo : 2\n",
"empeño : 2\n",
"en : 7\n",
"guerra : 3\n",
"y : 10\n",
"no : 2\n",
"firmar : 2\n",
"una : 2\n",
"paz : 2\n",
"por : 3\n",
"separado. : 2\n",
" : 9\n",
"prometiendo : 1\n",
"\"emplear : 1\n",
"todos : 1\n",
"sus : 1\n",
"recursos, : 1\n",
"militares : 1\n",
"o : 1\n",
"económicos\" : 1\n",
"\"la : 1\n",
"lucha : 1\n",
"victoria : 1\n",
"sobre : 1\n",
"el : 5\n",
"hitlerismo\". : 1\n",
"El : 2\n",
"día : 2\n",
"año : 1\n",
"nuevo : 1\n",
"1942, : 1\n",
"señor : 1\n",
"presidente : 2\n",
"Roosevelt : 1\n",
"señores : 1\n",
"Winston : 1\n",
"Churchill, : 1\n",
"Maxim : 1\n",
"Litvinov, : 1\n",
"Unión : 3\n",
"Soviética, : 1\n",
"T. : 1\n",
"V. : 1\n",
"Soong, : 1\n",
"China, : 2\n",
"firmaron : 1\n",
"un : 2\n",
"breve : 1\n",
"documento : 1\n",
"luego : 1\n",
"conocería : 1\n",
"como : 2\n",
"Unidas. : 2\n",
"Al : 1\n",
"siguiente : 1\n",
"sumaron : 1\n",
"representantes : 1\n",
"otras : 1\n",
"22 : 1\n",
"naciones : 1\n",
"más. : 1\n",
"alianza : 1\n",
"completa : 1\n",
"llegó : 1\n",
"esta : 1\n",
"forma : 1\n",
"concordaba : 1\n",
"con : 1\n",
"principios : 2\n",
"enunciados : 2\n",
"Atlántico, : 1\n",
"primera : 1\n",
"cláusula : 1\n",
"declaración : 2\n",
"reza : 1\n",
"países : 2\n",
". : 4\n",
"han : 1\n",
"suscrito : 1\n",
"programa : 1\n",
"común : 1\n",
"propósitos : 1\n",
"conjunta : 1\n",
"Unidos : 2\n",
"América : 1\n",
"primer : 1\n",
"ministro : 1\n",
"Reino : 2\n",
"Unido : 2\n",
"Gran : 2\n",
"Bretaña : 2\n",
"e : 2\n",
"Irlanda : 2\n",
"Norte, : 2\n",
"fechada : 1\n",
"14 : 1\n",
"agosto : 1\n",
"1941, : 1\n",
"conocida : 1\n",
"Atlántico. : 1\n",
"Cuando : 1\n",
"tres : 1\n",
"años : 1\n",
"después : 1\n",
"iniciaban : 1\n",
"preparativos : 1\n",
"para : 1\n",
"conferencia : 1\n",
"San : 1\n",
"Francisco, : 1\n",
"únicamente : 1\n",
"invitó : 1\n",
"participar : 1\n",
"aquellos : 1\n",
"estados : 1\n",
"que, : 1\n",
"marzo : 1\n",
"1945, : 1\n",
"habían : 2\n",
"declarado : 1\n",
"Alemania : 1\n",
"al : 1\n",
"Japón : 1\n",
"firmado : 1\n",
"Signatarios : 1\n",
"Originales : 1\n",
"ONU : 1\n",
"Los : 3\n",
"originales : 1\n",
"fueron: : 1\n",
"América, : 1\n",
"Repúblicas : 1\n",
"Socialistas : 1\n",
"Soviéticas, : 1\n",
"Australia, : 1\n",
"Bélgica, : 1\n",
"Canadá, : 1\n",
"Costa : 1\n",
"Rica, : 1\n",
"Checoeslovaquia, : 1\n",
"Salvador, : 1\n",
"Grecia, : 1\n",
"Guatemala, : 1\n",
"Haití, : 1\n",
"Honduras, : 1\n",
"India, : 1\n",
"Luxemburgo, : 1\n",
"Nicaragua, : 1\n",
"Noruega, : 1\n",
"Nueva : 1\n",
"Zelandia, : 1\n",
"Países : 1\n",
"Bajos, : 1\n",
"Panamá, : 1\n",
"Polonia, : 1\n",
"República : 1\n",
"Dominicana, : 1\n",
"Sudafricana, : 1\n",
"Yugoeslavia : 1\n",
"firmantes : 1\n",
"posteriores : 1\n",
"Más : 1\n",
"tarde : 1\n",
"adhirieron : 1\n",
"siguientes : 1\n",
"(en : 1\n",
"orden : 1\n",
"firmas): : 1\n",
"México, : 1\n",
"Colombia, : 1\n",
"Iraq, : 1\n",
"Irán, : 1\n",
"Liberia, : 1\n",
"Paraguay, : 1\n",
"Chile, : 1\n",
"Uruguay, : 1\n",
"Egipto, : 1\n",
"Siria, : 1\n",
"Francia, : 1\n",
"Filipinas, : 1\n",
"Brasil, : 1\n",
"Bolivia, : 1\n",
"Etiopía, : 1\n",
"Ecuador, : 1\n",
"Perú, : 1\n",
"Venezuela, : 1\n",
"Turquía, : 1\n",
"Arabia : 1\n",
"Saudita, : 1\n",
"Líbano. : 1\n"
]
}
],
"source": [
"#Se muestra las palabras con la cantidad de veces que tiene su aparición\n",
"for palabra, contador in contarPalabras.items():\n",
" print(\"{} : {}\".format(palabra, contador))"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment