Cours d'informatique








télécharger 66.27 Kb.
titreCours d'informatique
date de publication12.04.2017
taille66.27 Kb.
typeCours
p.21-bal.com > comptabilité > Cours
Cours d'informatique
I/quelques aspects de l'informatique.

D'où vient l'informatique et qu'est-ce que c'est.

 

information+automatique=informatique

Théorie de l'information ; émetteur <--------->récepteur . (<----->= code commun entre em et rec)

 

exemples de codes ;

- la langue : code écrit/oral, notion de redondance « un grand étudiant »>redondance signe masculin sing. Économie de la langue;> langue code avec règles ; mots-outils : que de le etc. (forme fonctionnelles) mots courts, fréquents, (courts parce que fréquents).

 

-la représentation des nombres :

a) 0123456789, numération de position a base 10 « 1524 » unités, dizaines, centaines, milliers.(1000+500+20+4). Depuis de 5eme siècle après J-C, et suppose un 0, sa vient d'Inde, amené par les arabes, au 10eme siècle après J-C.

 

b) notation scientifique, 100=10*10=10^2, 1 000=10^3.(espace 1 0, séparateur de millier , sert a lire les grands nombres)1 000 000=1000000=10^6.1000=kilo, 10^6 méga, 10^9 giga.

(la même chose avec les 0,0000001 etc) 10^-1 déci, centi...10^-6,micro, 10^-9 nano...

 

c) ordre de grandeur, infiniment grand, grand, distance Terre-lune +- 380 000 km, distance terre-soleil 150 000 000 km, vitesse lumière 300 000 km/s (Terre-soleil :8min), Année lumière : 10 000 000 000 000km, 10^13, Dix mil milliards de KM. Diamètre univers estimé ; 15 milliards d'années lumières . Même principe dans l'infiniment petit. Le plus petit truc connu est plus ou moins l'atome= qui ne peut être coupé, 10^-10m. Nombre d'atome dans un cellule : 1 000 milliards, nombre de cellules dans un humain : 10 000 milliards.

Infiniment grand : univers

infiniment petit : atome

10^11 galaxies, composées de 10^11 d'étoiles,Soleil : 10^27 tonnes ; 10^33 grammes, 10^24 atomes d'hydrogène par gramme d'hydrogène, nombre d'atomes dans univers = 10^11*10^11*10^33*10*24=10^79 atomes dans l'univers, (10^80 nombre officiel). 10^100 ; objet d'études maths, d'après la légende nommé par un gamin, Gogol, et ça a donner le nom de Google (dérivé anglais de Gogol), Google : indexation du web.

 

-codage binaire :

a) des 0 et des 1,lampe allumée ou éteinte:tubes a vides, lampes (début de l'informatique). Fils électrique, courant ou pas, interrupteur, miniaturisation transistor. Fibre optique lumière a place de courant. Aimants polarisés ou pas. CD DVD, creux bosses lues par laser. On représente par des oppositions des informations.

 

b)pourquoi des 0 et des 1 pour représenté l'information de manière automatique. On a envie de fiabilité, et de rapidité. Construire une machine qui fonctionne à base 10, 0>Ov, 1>1v....,9>9v, manque de précision , manque de fiabilité, manque de rapidité ? Ordinateur binaire 1-0, courant dans un sens, ou l'autre, plus de fiabilité, choix minimum, plus de rapidité.

 

c) code ASCII(American Standard Code for Information Interchange)

http://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange#LF.2C_CR.2C_fin_de_ligne

 

 

a>97, b>98, code ASCII, representation en binaire des caractères.

 

 

A 65 01000001

B 66 01000010

.

a 97 01100001

b 98 01100010

 

Tous les caractères sont représentés sur 8 caractères, c'est un code de longueur fixe, pour l'automatisation de la lecture, on évite les erreurs. Dans clavier 8 fils courant ou pas 0-1, OS=operationg system=système d'exploitation.

 

 

 

II/ repères chronologiques.

 

Première machine a calculé automatique, la Pascaline 1642, traitement mécanique.

L'ENIAC(Electronic Numerical Integrator Analyser and Computer), 30 tonnes, 1946, 85m2, 330 multiplications/sec 160 kW).

Manchester Mark I (université de Manchester) juin 1948, tubes cathodiques, un tube= 1024, premier vrai ordinateur, c'est a cause de cette machine qu'on dit bug, un des facteurs qui faisait griller les lampes se sont les lampes, d'où bugger.

l'UNIVAC(UNIVersal Automatic Computer) premier ordinateur commercial, premier exemplaire pour le bureau du recensement.

IBM 1952,premier ordinateur de IBM, 19 exemplaires, le premier pour le projet de bombe thermo-nucléaire.

IBM 650, 1953 premier ordinateur commercial en série, lent peu fiable couteux, 1000 exemplaires, compatible avec les machines de comptabilité a cartes perforées.

1956> premier ordinateur a transistor (Bell)> seconde génération d'ordinateurs.

1958> démonstration du premier circuit intégré (Texas Instruments)

1961> commercialisation de la première série de circuits intégrés.

1964>transistors replacés par circuits intégrés> troisième génération d'ordinateurs.

1971>premier microprocesseur d'Intel (assemblage de circuits intégrés) et premier micro-ordinateur.

1972> première calculatrice de poche programmable de Packard.

1977> l'ordinateur devient micro, avec l'apple II, premier micro-ordinateur capable d'afficher des graphiques en couleurs.

 

III/ un code américain.

  1. Position du problème.

code binaire, code uniforme(tous les caractères ont la même longueur) pour le traitement automatique.

Ont a besoin des majuscule A>Z(26), minuscules a>z(26), chiffres 0>9(10), opérations (10) ...etc> une centaine de caractères. Représenter une centaine de cratères avec des 0 et des 1.

Si 1 position > 2 possibilités.

Si 2 positions 0 et 1> 4 possibilités.

Si 3 positions > 8 possibilités.

Si 4 positions > 16 possibilités

5 32

6 64

7 128

Les caractères auront 7 positions de 0 et 1, 7 bits.

  1. Code correcteur d'erreur.

 

Exemple> numéro de Sécu. 13 chiffres+ une clé sur 2 chiffres. Information critique a transmettre, pour fiabilisé on met une clé a 2 chiffres, s'assurer que la transmission est bonne. L’émetteur transmet numéro sécu + clé, le récepteur recalcule la clé si ok= tout va bien, sinon= redonne moi ton numéro.

  1. du code ASCII au codes ASCII étendus.

Pour fiabilisé les vielles machines on a utilisé un code correcteur d'erreur. On a ajouté un bit aux 7 premiers, comme code correcteur d'erreur, c'est le bit de parité. Si nombre de 1 impair alors parité=1, sinon =0. énorme gain de fiabilité par la miniaturisation> on a plus besoin de la clé, de code correcteur d'erreur. On récupère donc le 8e bit, on a donc 256 possibilités de codage. Il y a autans de codes ASCII que l'on veut, en fonction des caractères dont on a besoin.

  1. quantité d'information.

Unité minimum d'information> un bit. 8bit>un octet, un caractère un byte.

1Ko>1024 octets, 1Mo, 1Go, 1To, 1Po(pétaoctet). A chaque fois on fait *1000.

Mémoire vive RAM> en Go quelques Go, (l'apple II c'était quelques Ko).

Mémoire flash > centaines de Go, clés USB, CD/DVD/BluRay> 700Mo>18Go, Disques dur> 100Go>1To.

 

IV/ INTERNET : repère chronologiques technologiques.

  1. chronologie

1967 :ARPANET, réseau civil américain, financer par les militaire, conçu pour résister aux pannes, 4 machines.

1971 : naissance du mail et protocole SMTP, 23 machines connectés.

1983 :mise au point du protocole TCP/IP, 1000 machines connectés.

1990 : invention du WWW(World Wide Web) par des physiciens au CERN a Genève.

  1. ARPANET.

Advenced Reserche Project Agency NETwork, agence militaire, projet de recherche pour un réseau, elle a passer commande aux universités d'un réseau de transmission de donné résistant aux pannes.

Internet, réseau sans central, on établit pas un circuit entre 2 personnes,on utilise la commutation de paquets.

L'information a transmettre est découpée en paquets. Chaque paquet est émis indépendamment sur le réseau. Les nœuds du réseau aiguillent(routent) les paquets, individuellement, vers le récepteur. L'information est reconstituée a l'arrivée. C'est la technique d'internet, ça permet 2 choses

> résistance aux pannes

>optimiser l'utilisation des lignes.

 

  1. SMTP

Simple Mail Tranfert Protocol> ce qui achemine les mails encore aujourd'hui, c'est le protocole utilisé pour le transfert des courriers électroniques, il gère le transfert entre les différents serveurs de messageries. Il gère aussi quand les serveurs sont en rade, il les conserve un certain temps avant que le message soit renvoyé. C'est assez proche du système de SMS.

 

  1. TCP/IP

c'est le protocole qui gère l'internet> Transmission Control Protocol/ Internet working Protocol. Il assure la transmission de l'information sous forme de paquets.

 

  1. HTML

Hyper Text Markup Language > langage des pages web. Favorisation de la navigation, langage a ba se de balises. Les balises > ... > pour mettre en gras.

 

  1. HTTP

Hyper Text Transfert Protocol> règles de transmission entre navigateur et serveurs web. Des fois c'est HTTPs> pour les pages sécurisées, quand on parle avec le serveur, quand on vas sur la banque par exemple, il y a un HTTPs, l'information est cryptée.

 

le chemin d'une requête.

 

Requête de 524 à Google> cheminement.

 

I/ la route physique.

 

Ce qui se passe d'abord a censier, jusqu'à Google USA.

Le PC est dans un réseau d'une salle. Le réseau de la salle est relié a un routeur d'étage, celui du 5e. Les routeurs d'étages sont reliés a un routeur de Bâtiment, censier(le tout est en câblé). Le routeur bâtiment est relié au réseau RAP(réseau académique parisien) fait de fibre optique, il passe par les égouts de Paris. RAP est connecté au réseau RENATER( RÉseau NAtional pour la Technologie l'Enseignement et la Recherche)connexion a Jussieu, les universités de France, et d'autres chose, les grandes écoles, CEA, l'INSERN, le CNRS, EDF etc. Puis on arrive a l'INTERNET.FR, connexion assurée par F.TELECOM. Pour arriver a l'INTERNET USA on traverse par des câbles sous-marins, ils font 5 000 KM. Après au USA il y a peu près le même système de réseaux poupées russes que en France, tout pour arriver chez Google. La requête a fait ce chemin, elle a fait plus ou moins 20 000 km, la réponse fait le même chemin au retour.

Ce qui a dans la requête> ce qu'on demande a Google, d'où la requête vient, où elle doit aller.

 

II/ du physique au logique.

 

Opposition physique/logique> un texte, c'est fait de mots, faits de lettres, qui est codée, un code octet, vers un circuit... . De la lettre au texte chemin vers le logique croissant, de la lettre au code, au circuit... c'est vers le physique croissant.

 

  1. adresses IP

illustration passage physique logique. Tous les dispositifs connectée a Internet doivent être identifiés de manière unique, par leur adresse IP. Sa fonctionne comme les plaques d'immatriculation des voitures.

IP(actuelle)> V4> identification/adresse sur 4 octets(pas pour sa que c'est V4), lors de sa création il y avait 1000 machines connectées, besoin de 1000 adresses. 4 octets> 4*8bits> 32bits, 2^32 possibilités de codage> d'adresses différentes, plus ou moins 4 milliards. Adresse IP> ******** ******** ******** ********, une *= O ou 1. pour facilité la lecture des IP> sous la forme de 4 nombres > 193.25.105.255 (exemple au hasard). On change de version d'IP car on en a plus assez, on va dépasser les 4milliards. On est en migration vers l'IP V6. C'est une migration lourde, tous les réseaux et les routeurs doivent s'y mettre. Le codage se fera alors sur 16 octets, 128 bits, nombre énorme, 2^128 adresses, sa fait beaucoup, 667m millions de milliards d'adresses IP, par mm2 de surface terrestre.

 

  1. Routeurs.

Un routeur, c'est un dispositif intermédiaire qui assure l'acheminement des paquets. Selon des tables de routage qui sont établies établies (entre autres) en fonction de l'état du réseau. Un routeur a des amonts et des avals, la table de routage c'est ce qui lui permet de voir par où envoyer l'information, en fonction de où ça vas et de l'encombrement du réseau. Toutes les routeurs optimisent le chemin pris par les paquets. C'est grâce a ça que internet est aussi performant.

 

  1. DNS.

 

 

Correspondance adresse physique(IP) et adresse logique(www****.**). Domain Name System, quand on envoie une requête a Google> c'est traduit en physique par le serveur DNS, internet marcherai pas sans ça, les FAI(fournisseur d'accès internet) on chacun un DNS. C'est le FAI qui fait la liaison avec le serveur DNS, puis chez Google. Le DNS est une sorte de dictionnaire, et chaque FAI l'a, et le met a jours de temps en temps. C'est le protocole de mise a jour des serveurs qui met a jour le contenu du DNS.

 

 

III/Un second niveau d'élaboration.

 

  1. Analyse de la requête.

 

 

La requête est arrivée. 1> analyse linguistique, quelle est la langue demandée. On peut penser a passer en majuscule, pour éviter les problèmes l'accents, les oublis de majuscules etc. On va Défléchir la requête, c'est de la linguistique, encore, on cherche les dérivés des mots, c'est remonter au mot racine. Il faut aussi tenir compte de l'ordre des mots. Il tien aussi compte de la proximité des mots.

 

 

  1. Un préalable.

 

 

Constitution d'index.grands dictionnaires multilingue du web. Constitués par des programmes, des robots qui parcourent le web en permanence, ils index les pages web. Ils index avec les même processus que la requête, langue, mots clés, en majuscules et défléchis. Les auteurs des site web donnent des indications pour aider les petits robots (dates de MAJ, de péremption …). les robots sont aidés par les DNS aussi. Les inex ainsi constitués font la rapidité des moteurs de recherche.

 

 

  1. la pertinence des réponses.

 

 

a) dès l'origine

 

 

Dans HTML, dans chaque il y a des métadonnées, ce qui permet d'indexer, pour chaque pages. Déclarés par l'auteur de la pages. L'internet a été détourné, choisir des mots clés pour la page, afin de d'avoir des visites sur la page.

b) indexation en texte intégral

 

 

le robot va dans les pages et met une note en fonction de la fréquence du mot recherché. Le mot clé est pondéré, plus son quotient est élever mieux c'est. On met des blanc dans la page et on écrit en tout petit de la couleur du fond le mot clé désiré, comme ça on a un gros quotient.

 

 

c) Page Rank (du nom d'un des créateurs de Google)

 

 

il avait son blog, avec la pub pour ce qu'il aime. Il voulait savoir qui parlait de lui. Il a donc utilisé un robot qui parcours le web et qui cherche les citations. Il a détourner le robot pour la recherche des citations. Le page rank, est un classement de pertinence, le robot recherche les liens qui amènent a une page donnée. On fait un grand dictionnaire des liens. On crée un indice de crédibilité des pages. C'est un indice de popularité +populaire=+crédible.

 

 

FINANCEMENT DES SITES, par la publicité, google, par les google Adwords, suggestions, sites commerciaux. Acheter au click et aux enchères. Ou publicité a l'affichage.

VALEUR DES SITES, diffèrent du financement, bases de donnés de consommateurs qualifiés, profils marketing.

 

 

COMPRESSION DES DONNÉES

 

 

-Principe

°réduire la taille des fichiers, en éliminant les répétitions, la redondance (théorie de l'information), soit les données considérés comme superflues.

°Elle permet de limiter l'encombrement des supports. Diminuer l'encombrement des réseaux.

°Elle mobilise, entre autre, la théorie de l'information, la théorie des nombres, les statistiques, le traitement du signal (sonore, vidéo), l’algorithmique.

 

 

-Exemples

 

 

°RLE, Run Length Encoding, on a un fichier, qui commence par 58 58 58 58 31 31 31 31 20 101 101 101 101... le principe c'est de dire que ce fichier a ne longueur de 13 octet, mais 4*58, 3*31, 1*20, 5*101 >

donc 58 04 31 03 20 01 101 05, donc 8 octets, rapide, pas de calcule. Ce n'est pas fait pour des textes, mais pour les graphiques c'est performant, base du format PCX (paint et autre)

 

 

°Compression de Huffman, d'après le code ASCII, codage uniforme, 1 caractère=1octet. Optimisation du codage, changer le code, le E très fréquent (17%)donc codé sur 6 bits (au lieux de 8)>> donc W peu fréquent(0,04%) codé sur 10 bits. Un texte avec 10 000 caractères, donc 17000 E, donc 3400 bits de gain. 4 W, 8 bits de pertes, donc gain de 3392. Principe > re-codage, a partir d'un dictionnaire, codé plus long ce qui est peu fréquent, et moins long les caractères les plus fréquents. 2 sortes de compressions, une par dictionnaire fixe, comme exemple.

L'autre, comme zip, il prend le fichier, il l'explore, il élabore un dictionnaire des fréquences, il applique ensuite la compression de Huffman en fonction des données du fichier. La compression LZW est une variante de la compression de Huffman.

°Delta compression, Δ compression, signe des différence, le principe est basé sur des tranches de dictionnaire, (table/tables/tablent/tableur/tableurs>>33 caractères) pour raccourcir> on note le mot ancre puis ce qui change donc table+nt+s+ur+urs >>> donc 17 caractères au lieux de 33, compression de plus de 50%. Le correcteur est basé sur ce principe, mais si l’erreur est sur le début il ne donne pas la bonne suggestion. La Δcompression est aussi utilisée pour la télévision et surtout la télévision numérique. 1 image > fichier lourd. L'image est composé de pixels, chaque pixels a 3 attributs de couleur et 1 attribut de luminosité. Entre une image et l'autre, il y a peu de changement. La télévision numérique envoie une image puis la différence avec la précédente. Au lieux d'envoyer 25images/s, en envoi presque rien/s.

 

 

°Performances, base de données, tableurs, a peu près les même performances, plein de trous. Rapport de 1:5, le fichier comprimer est 5 fois plus petit que le fichier de base 80%. Le texte est comprimé a environ 60%. une image a 50%, 1:2. >>> compression sans perte.

 

 

-Compression avec perte

 

 

°MP3, enlever tout ce qui n'est sous disant pas audible. On enlève ce qui est trop bref pour être perçu, il nous enlève les son trop aigus ou graves, les ultrasons et les infrasons. Et on compresse. > 1:12, 1:10.

 

 

°JPEG, même principe, plus ou moins, Joint Photographie Expert Group, sa tient compte des caractéristiques de l'œil humain, sensible a la luminance très sensible, aux contrastes, et peu sensible a la chrominance, aux couleurs, sa touche uniquement les couleur. Il diminue la palette de couleurs, environ 256 couleurs. Puis il applique la compression. 1:20.

 

 

°MPEG 2 / 4, Moving Picure Expert Group, on prend chaque image, on la met en JPEG, puis delta compression.

 

 

 

 

TRAITEMENT DE TEXTE.

 

 

  1. Un héritier.

a) machines a écrire

°clavier

QWERTY> clavier américain,non commode, fait exprès pour ralentir la frappe, pour éviter que les bras ne s'entremêlent. Les chiffres sont au niveau minuscule.

AZERTY >> chiffres au niveau majuscule pour avoir les accents et autre.

 

 

°caractères de contrôle.

« Bell » « back space » « tab » etc, même l'espèce de P a l'envers qui est un caractère non imprimable.

Le format RTF c'est Rich text format >> texte avec la mise en page. Tout les traitements de texte lisent et écrivent le RTF.

 

 

b) la typographie.

Une culture depuis l'invention de l'imprimerie. Il y a des règles, règles de mise en forme de typographie en France : -signes de ponctuation simple ,. >> pas d'espace avant > espace après.

-singes de ponctuation doubles :?;! espace avant et après.

 

 

  1. un logiciel complexe.

a) la frappe au kilomètre >> on frappe sans se préoccuper des fins de lignes > passage a la ligne automatique.

b) un peu de rigueur, les caractères, caractères séparateurs de mots/les vrai caractères/ ceux qui sont soit l'un soit l'autre en fonction des situations.

 

 

 

 

similaire:

Cours d\Cours d’informatique 1

Cours d\Cours : n otions de base sur les réseaux Informatique

Cours d\Maintenance informatique. Préparer un équipement informatique

Cours d\000 – informatique information 04 Informatique

Cours d\Examen de réseau informatique

Cours d\Ingenieur informatique secteur audiovisuel

Cours d\Programme de doctorat en informatique cognitive

Cours d\Module 1 : Informatique – Notions de base

Cours d\2010 Titre professionnel de Technicien d’Assistance en Informatique

Cours d\«Clientèle de la ssii neresys Informatique dans un cadre contractuel»








Tous droits réservés. Copyright © 2016
contacts
p.21-bal.com