计算机编程语言
https://www.cnblogs.com/Kevin-Yang/p/11221332.html 最近博客园的文章 周天还没时间仔细看。 等工作日时仔细看一下。
用于表达数字计算机的一组详细指令的各种语言。 当这些指令处于称为机器语言的计算机制造商特定数字形式时,在用相应汇编语言表达的简单替换过程之后,或者在从某些“更高级别”语言翻译之后,可以直接执行这些指令。 虽然有许多计算机语言,但相对较少被广泛使用。
机器和汇编语言是“低级别的”,要求程序员明确管理计算机的所有数据存储和操作的特殊功能。 相比之下,高级语言可以防止程序员担心这些注意事项,并提供程序员更容易编写和读取的符号。
<!-- Low Level Language -->
机器语言和汇编语言(Machine and assembly languages)
<!-- High Level Language -->
算法语言(Algorithmic languages)
FORTRAN
ALGOL
LISP
C
面向商业的语言(Business-oriented languages)
COBOL
SQL
面向教育的语言(Education-oriented languages)
BASIC
Pascal
Logo
Hypertalk
面向对象的语言(Object-oriented languages)
C++
Ada
Java
Visual Basic
声明性语言(Declarative languages)
脚本语言(Scripting languages)
文档格式化语言(Document formatting languages)
TeX
PostScript
SGML
万维网显示语言(World Wide Web display languages)
HTML
XML
Web scripting
元素编程语言(Elements Of Programming)
Control structures
Data structures
语言类型
机器语言和汇编语言(Machine and assembly languages)
机器语言由特定计算机可以直接执行的操作数字代码组成。 代码是0和1的字符串,或二进制数字(“位”),它们经常被转换为十六进制(基数16)以供人类查看和修改。 机器语言指令通常使用一些位来表示操作,例如加法,一些用于表示操作数,或者可能用于表示下一条指令的位置。 机器语言难以读写,因为它不像传统的数学符号或人类语言,并且其代码因计算机而异。
汇编语言旨在轻松转换为机器语言。 尽管可以通过名称而不是通过其机器地址来引用数据块,但是汇编语言不提供组织复杂信息的更复杂的方法。 与机器语言一样,汇编语言需要详细了解内部计算机体系结构。 当这些细节很重要时,如在编程计算机以与输入/输出设备(打印机,扫描仪,存储设备等)交互时,它是有用的。
算法语言(Algorithmic languages)
算法语言旨在表达数学或符号计算。 它们可以用类似于数学的符号表示代数运算,并允许使用包含常用操作的子程序进行重用。 它们是第一种高级语言。
FORTRAN
第一个重要的算法语言是FORTRAN(公式转换),由John Backus领导的IBM团队于1957年设计。 它旨在用于实数的科学计算,并将它们的集合组织为一维或多维数组。 其控制结构包括条件IF语句,重复循环(所谓的DO循环)和允许非顺序执行程序代码的GOTO语句。 FORTRAN使得用于常见数学运算的子程序变得方便,并且构建了它们的库。
FORTRAN还旨在转化为高效的机器语言。 它立即成功并继续发展。
ALGOL
ALGOL(算法语言)由美国和欧洲计算机科学家委员会在1958年至1960年期间设计,用于发布算法以及进行计算。 与LISP(在下一节中描述)一样,ALGOL具有递归子程序 - 可以调用自身来解决问题的过ALGOL为描述编程语言Backus-Naur Form的结构提供了一种符号,Backus-Naur Form在某些变体中成为说明编程语言语法(语法)的标准工具。 ALGOL在欧洲广泛使用,多年来它仍然是计算机算法发布的语言。 许多重要的语言,如Pascal和Ada(后面都有描述),都是它的后代。程,将其减少为同类的较小问题。 ALGOL引入了块结构,其中程序由可能包含数据和指令的块组成,并且具有与整个程序相同的结构。 块结构成为用于构建小型组件的大型程序的强大工具。
LISP
LISP(列表处理)是由约翰麦卡锡在麻省理工学院(MIT)于1960年开发的,它建立在递归函数的数学理论之上(其函数出现在它自己的定义中)。 LISP程序是应用于数据的函数,而不是FORTRAN和ALGOL中的一系列程序步骤。 LISP使用一种非常简单的表示法,其中操作及其操作数在括号列表中给出。例如,(+ a(* b c))代表a + b * c。虽然这看起来很尴尬,但这种符号适用于计算机。 LISP还使用列表结构来表示数据,并且由于程序和数据使用相同的结构,因此LISP程序很容易在其他程序上作为数据运行。
LISP成为人工智能(AI)编程的通用语言,部分原因是由于LISP和AI工作在麻省理工学院的合作,部分原因是能够“学习”的AI程序可以用LISP编写为自修改程序。 LISP通过众多方言发展,例如Scheme和Common LISP。
C
C编程语言由AT&T公司的Dennis Ritchie和Brian Kernighan于1972年开发,用于编程计算机操作系统。它通过较小单元的组合构建数据和程序的能力与ALGOL相当。它使用紧凑的表示法,使程序员能够使用数据地址及其值进行操作。这种能力在系统编程中很重要,C与汇编语言共享可以利用计算机内部架构的所有功能。 C及其后代C ++仍然是最常用的语言之一。
面向商业的语言(Business-oriented languages)
COBOL
COBOL(通用业务导向语言)自1959年成立以来一直被企业大量使用。计算机制造商和用户委员会以及美国政府组织成立了CODASYL(数据系统和语言委员会),以开发和监督语言标准,以便确保其在不同系统中的可移植性。
COBOL在介绍时使用类似英语的符号小说。业务计算组织和操作大量数据,COBOL为这些任务引入了记录数据结构。记录将异构数据(例如姓名,ID号,年龄和地址)聚合到一个单元中。这与科学语言形成对比,在这种语言中,同质数组是常见的。记录是将数据“分块”成单个对象的重要示例,它们几乎出现在所有现代语言中。
SQL
SQL(结构化查询语言)是一种用于指定数据库组织(记录集合)的语言。使用SQL组织的数据库称为关系数据库,因为SQL提供了查询数据库以查找属于给定关系的信息的功能。例如,查询可能是“查找包含last_name Smith和city New York的所有记录。”商业数据库程序通常使用类似SQL的语言进行查询。
面向教育的语言(Education-oriented languages)
BASIC
BASIC(初学者的通用符号指令代码)是由John Kemeny和Thomas Kurtz于20世纪60年代中期在达特茅斯学院设计的。它旨在让初学者,特别是非计算机科学专业的学生容易学习,并且在具有许多用户的分时计算机上运行良好。它具有简单的数据结构和符号,并且被解释为:BASIC程序逐行翻译并在翻译时执行,这使得查找编程错误变得容易。
它的小巧和简洁也使BASIC成为早期个人电脑的流行语言。它最近的形式采用了其他当代语言的许多数据和控制结构,这使得它更强大但对初学者来说不太方便。
Pascal
大约1970年,瑞士的Niklaus Wirth设计了Pascal来教授结构化编程,强调了在没有GOTO语句的情况下有条理地使用条件和循环控制结构。 虽然Pascal在表示法中类似于ALGOL,但它提供了定义用于组织复杂信息的数据类型的能力,这是超出ALGOL以及FORTRAN和COBOL功能的功能。 用户定义的数据类型允许程序员引入复杂数据的名称,然后语言翻译者可以在运行程序之前检查其是否正确使用。
在20世纪70年代末和80年代,Pascal是最广泛使用的编程指令语言之一。 它几乎可以在所有计算机上使用,并且由于其熟悉性,清晰度和安全性,它被用于生产软件和教育。
LOGO
标志起源于20世纪60年代后期,作为教育的简化LISP方言; Seymour Papert和其他人在麻省理工学院用它来向学龄儿童传授数学思维。它有一个比LISP更传统的语法,并以“乌龟图形”为特色,这是一种生成计算机图形的简单方法。 (这个名字来自一个早期项目,用于编写一个类似乌龟的机器人。)海龟图形使用了以身体为中心的指令,其中一个对象通过命令移动到屏幕上,例如“左90”和“前进”,指定相对的动作到目前的对象的位置和方向,而不是固定的框架。与递归例程一起,这种技术使得编写复杂和有吸引力的模式变得容易。
Hypertalk
Hypertalk是由Bill Atkinson为Apple的Macintosh设计的“我们其他人的编程”。使用简单的类似英语的语法,Hypertalk使任何人都可以快速将文本,图形和音频组合成“链接堆栈”,可以通过在程序提供的标准按钮上单击鼠标来导航。在20世纪80年代和90年代早期,Hypertalk在教育工作者中特别受欢迎,用于课堂多媒体演示。尽管Hypertalk具有面向对象语言的许多功能(在下一节中描述),但Apple并没有为其他计算机平台开发它并让它萎靡不振;随着苹果公司在20世纪90年代的市场份额下降,一种新的跨平台显示多媒体的方式使得Hypertalk几乎已经过时(参见万维网显示语言部分)。
面向对象的语言(Object-oriented languages)
面向对象的语言有助于管理大型程序的复杂性。对象打包数据及其上的操作,以便只有操作可公开访问,并且隐藏数据结构的内部细节。通过允许程序员单独考虑程序的每个部分,这种信息隐藏使大规模编程变得更容易。此外,对象可以从更一般的对象派生,“继承”它们的能力。这样的对象层次结构使得可以定义专用对象而不重复更一般的对象中的所有对象。
面向对象的编程始于Simula语言(1967),它为ALGOL添加了隐藏信息。另一个有影响力的面向对象语言是Smalltalk(1980),其中一个程序是一组通过彼此发送消息来交互的对象。
C ++
C ++语言由Bjarne Stroustrup在20世纪80年代中期在AT&T开发,通过在保留C程序效率的同时添加对象来扩展C语言。它一直是教育和工业编程最重要的语言之一。许多操作系统的大部分,例如Microsoft Corporation的Windows 98,都是用C ++编写的。
Ada
阿达以奥古斯塔·阿达·金(Augusta Ada King)的名字命名,她是洛夫莱斯的伯爵夫人,曾是19世纪英国发明家查尔斯·巴贝奇的助手,有时被称为第一位计算机程序员。阿达语是20世纪80年代初为美国国防部开发的大规模节目。它将类似Pascal的表示法与将操作和数据打包成独立模块的能力相结合。它的第一个形式Ada 83并不是完全面向对象的,但随后的Ada 95提供了对象以及构造它们的层次结构的能力。虽然Ada不再被授权用于国防部的工作,但仍然是工程大型项目的有效语言。
Java
在20世纪90年代早期,Java由Sun Microsystems,Inc。设计,作为万维网(WWW)的编程语言。虽然它在外观上类似于C ++,但它完全是面向对象的。特别是,Java省去了较低级别的功能,包括操作数据地址的能力,这种功能在分布式系统的程序中既不可取也不实用。为了便于移植,Java程序由特定于每个计算机平台的Java虚拟机翻译,然后执行Java程序。除了通过Web“applet”向Internet添加交互功能之外,Java还被广泛用于编写小型便携式设备,例如移动电话。
Visual Basic
Visual Basic是由Microsoft开发的,通过添加对象和“事件驱动”编程来扩展BASIC的功能:按钮,菜单和图形用户界面(GUI)的其他元素。 Visual Basic也可以在其他Microsoft软件中用于编写小例程。
声明性语言(Declarative languages)
声明性语言,也称为非过程或非常高级别,是编程语言,其中(理想情况下)程序指定要执行的操作而不是如何执行。在这些语言中,程序的规范与其实现之间的差异小于到目前为止所描述的过程语言。两种常见的声明性语言是逻辑和函数语言。
逻辑编程语言,其中PROLOG(逻辑编程)是最熟知的,将程序称为一组逻辑关系(例如,祖父母是某人的父母的父母)。这些语言类似于SQL数据库语言。程序由“推理引擎”执行,该推理引擎通过系统地搜索这些关系来回答查询以做出将回答查询的推断。 PROLOG已广泛用于自然语言处理和其他AI程序。
功能语言具有数学风格。通过将函数应用于参数来构造函数程序。功能语言,如LISP,ML和Haskell,被用作语言开发,自动数学定理证明器和一些商业项目中的研究工具。
脚本语言(Scripting languages)
脚本语言有时被称为小语言。它们旨在解决相对较小的编程问题,这些问题不需要数据声明的开销和使大型程序易于管理所需的其他功能。脚本语言用于编写操作系统实用程序,用于特殊用途的文件操作程序,并且因为它们易于学习,有时用于相当大的程序。
PERL(实用提取和报告语言)是在20世纪80年代后期开发的,最初用于UNIX操作系统。它旨在拥有早期脚本语言的所有功能。 PERL提供了许多方式来陈述常见操作,从而允许程序员采用任何方便的方式。在20世纪90年代,它成为一种系统编程工具,无论是小型实用程序还是大型原型程序。与下面讨论的其他语言一起,它也变得流行于编程计算机Web“服务器”。
文档格式化语言(Document formatting languages)
文档格式化语言指定打印文本和图形的组织。它们分为几类:文本格式符号可以提供与文字处理程序相同的功能,页面描述语言由打印设备解释,最常见的是标记语言,用于描述文档各部分的预期功能。
TeX
TeX是1977-86期间开发的,由斯坦福大学教授唐纳德·克努特(Donald Knuth)用作文本格式化语言,以提高他书中数学符号的质量。文本格式化系统与WYSIWYG(“所见即所得”)字处理器不同,在文档中嵌入纯文本格式化命令,然后由语言处理器解释这些命令以生成用于显示或打印的格式化文档。 TeX标记斜体文本,例如,{\ it it is iticicized},然后显示为斜体。
TeX很大程度上取代了早期的文本格式语其强大而灵活的功能使专家能够精确控制字体的选择,表格的布局,数学符号以及文档中图形的包含。它通常在“宏”包的帮助下使用,这些包定义了用于常见操作的简单命令,例如启动新段落; LaTeX是一种广泛使用的包。 TeX包含用于不同类型文档的许多标准“样式表”,并且这些可以由每个用户进一步调整。还有一些相关的程序,如BibTeX,管理书目,并具有所有常见书目样式的样式表,以及具有各种字母的语言的TeX版本。
PostScript
PostScript是一种页面描述语言,由Adobe Systems Incorporated在20世纪80年代早期在Xerox PARC(Palo Alto研究中心)的工作基础上开发。这些语言描述的文件可以由个人计算机解释,以在其屏幕上或通过打印机或排版设备中的微处理器显示文档。
例如,PostScript命令可以以各种字体和大小精确定位文本,绘制数学描述的图像,并指定颜色或阴影。 PostScript使用后缀,也称为反向波兰表示法,其中操作名称跟随其参数。因此,“300 600 20 270弧形行程”意味着:在位置(300,600)处绘制(“行程”)270度弧,半径为20。尽管PostScript可以由程序员读取和写入,但它通常由文本格式化程序,文字处理器或图形显示工具生成。
PostScript的成功归功于其规范属于公共领域,并且与高分辨率激光打印机非常匹配。它影响了打印字体的发展,制造商生产各种各样的PostScript字体。
SGML
SGML(标准通用标记语言)是标记语言定义的国际标准;也就是说,它是一种元语言。标记由称为标记的符号组成,这些标记指定文本的功能或如何显示。 SGML强调描述性标记,其中标记可能是“<emphasis>”。这样的标记表示文档功能,它可以被解释为计算机屏幕上的反向视频,打字机下划线或排版文本中的斜体。
SGML用于指定DTD(文档类型定义)。 DTD通过指定文档中必须出现的元素(例如,<Title>)来定义一种文档,例如报表,并为文档元素的使用提供规则,例如段落可能出现在表条目中但是表格可能不会出现在段落中。解析程序可以分析标记的文本以确定它是否符合DTD。另一个程序可以读取标记以准备索引或将文档翻译成PostScript以进行打印。另一种可能会为视觉或听觉障碍的读者生成大型或音频。
万维网显示语言(World Wide Web display languages)
HTML
万维网是用于在计算机监视器上显示通过因特网检索的文本,图形和音频的系统。每个检索单元称为网页,这些页面通常包含允许检索相关页面的“链接”。 HTML(超文本标记语言)是用于编码网页的标记语言。它由Tim Berners-Lee于20世纪80年代在瑞士CERN核物理实验室设计,由SGML DTD定义。 HTML标记标记指定文档元素,例如标题,段落和表格。它们标记文档以供计算机程序(称为Web浏览器)显示。浏览器解释标签,在布局中显示标题,段落和表格,以适应屏幕大小和可用的字体。
HTML文档还包含锚点,这些锚点是指定指向其他网页的链接的标记。锚的形式为<A HREF= "http://www.britannica.com">EncyclopædiaBritannica</A>,其中引用的字符串是链接指向的URL(通用资源定位符)(Web“地址) “)及其后面的文本是Web浏览器中显示的内容,下划线表示它是指向另一个页面的链接。显示为单个页面的内容也可以由多个URL形成,一些URL包含文本和其他图形。
XML
HTML不允许定义新的文本元素;也就是说,它不可扩展。 XML(可扩展标记语言)是SGML的简化形式,适用于在Web上发布的文档。与SGML一样,XML使用DTD来定义文档类型以及它们中使用的标记的含义。 XML采用易于解析的约定,例如文档实体由开始和结束标记标记,例如<BEGIN> ... </ BEGIN>。 XML提供比HTML更多种类的超文本链接,例如双向链接和相对于文档子部分的链接。
因为作者可以定义新标记,所以XML DTD还必须包含指示Web浏览器如何解释它们的规则 - 如何显示实体或如何生成诸如准备电子邮件之类的操作。
Web scripting
标记有HTML或XML的网页主要是静态文档。 Web脚本可以在读者使用它时向页面添加信息,或者让读者输入可以例如传递给在线业务的订单部门的信息。 CGI(通用网关接口)提供了一种机制;它在读者的Web浏览器和提供页面的Web服务器之间传输请求和响应。服务器上的CGI组件包含称为脚本的小程序,这些程序从浏览器系统获取信息或提供用于显示的信息。一个简单的脚本可能会询问读者的姓名,确定读者使用的系统的Internet地址,并打印问候语。脚本可以用任何编程语言编写,但是,因为它们通常是简单的文本处理例程,所以像PERL这样的脚本语言是特别合适的。
JavaScript
另一种方法是使用为Web脚本设计的语言由浏览器执行。 JavaScript就是这样一种语言,由Netscape Communications Corp.设计,可以与Netscape和微软的浏览器一起使用。 JavaScript是一种简单的语言,与Java完全不同。 JavaScript程序可以嵌入到具有HTML标记<script language =“JavaScript”>的网页中。选择页面后,浏览器将执行该标记后面的JavaScript指令。为了加速动态(交互式)页面的显示,JavaScript通常与XML或其他语言结合使用,以便在服务器和客户端浏览器之间交换信息。特别是,XMLHttpRequest命令启用来自服务器的异步数据请求,而不需要服务器重新发送整个Web页面。编程的这种方法或“哲学”称为Ajax(异步JavaScript和XML)。
VB脚本是Visual Basic的子集。最初是为Microsoft Office程序套件开发的,后来也用于Web脚本。它的功能类似于JavaScript,它可以以相同的方式嵌入HTML中。
使用这种脚本语言进行Web编程的背后是组件编程的想法,其中程序是通过组合独立的先前编写的组件而无需任何进一步的语言处理来构造的。 JavaScript和VB Script程序被设计为可以附加到Web浏览器的组件,以控制它们显示信息的方式。
元素编程语言(Elements Of Programming)
尽管存在符号差异,但当代计算机语言提供了许多相同的编程结构。这些包括基本控制结构和数据结构。前者提供表达算法的手段,后者提供组织信息的方法。
控制结构(Control structures)
用过程语言编写的程序,最常见的类似于食谱,有成分列表和使用它们的逐步说明。几乎每种程序语言中的三种基本控制结构是:
1.顺序 - 混合液体成分,然后加入干燥的成分。
2.有条件 - 如果西红柿是新鲜的,那么煨它们,但如果罐装,跳过这一步。
迭代击败蛋清直到形成软峰。
Sequence是默认的控制结构;说明一个接一个地执行。例如,它们可以执行一系列算术运算,将结果分配给变量,以找到二次方程ax2 + bx + c = 0的根。条件IF-THEN或IF-THEN-ELSE控制结构允许程序遵循替代执行路径。迭代或循环为计算机提供了大部分功能。他们可以根据需要重复一系列步骤,适当重复非常简单的步骤可以解决复杂的问题。
可以组合这些控制结构。序列可能包含几个循环;循环可以包含嵌套在其中的循环,或者条件的两个分支可以包含具有循环和更多条件的序列。在本文中使用的“伪代码”中,“*”表示乘法,“←”用于为变量赋值。以下编程片段使用IF-THEN结构来查找二次方程的一个根,使用二次方程式:
二次公式
二次公式假设a是非零并且判别式(平方根符号内的部分)不是负的(为了获得实数根)。条件检查这些假设:
上述片段中使用的SQUARE_ROOT函数是子程序(也称为过程,子例程或函数)的示例。子程序就像是一次给出的酱汁配方,并作为许多其他食谱的一部分使用。子程序接受输入(需要的数量)并产生结果(酱汁)。常用的子程序通常位于提供语言的集合或库中。子程序可以在其定义中调用其他子程序,如以下程序所示(其中ABS是绝对值函数)。 SQUARE_ROOT是通过使用WHILE(不定)循环实现的,该循环产生实数的平方根的良好近似,除非x非常小或非常大。通过声明其名称,输入数据类型和输出来编写子程序:
子程序可以将问题分解为更小,更易处理的子问题。 有时可以通过将问题减少到原始版本较小的子问题来解决问题。 在这种情况下,例程被称为递归子程序,因为它通过重复调用自身来解决问题。 例如,数学中的阶乘函数(n!= n?(n-1)?3?2?1,即前n个整数的乘积)可以编程为递归例程:
递归的优点在于它通常是对精确定义的简单重述,避免了迭代解决方案的簿记细节。
在机器语言级别,循环和条件是用分支指令实现的,分支指令说“跳转到”程序中的新点。高级语言中的“goto”语句表达相同的操作,但很少使用,因为它使人类难以遵循程序的“流程”。某些语言(如Java和Ada)不允许这样做。
数据结构(Data structures)
控制结构组织算法,而数据结构组织信息。特别是,数据结构指定数据类型,因此可以对它们执行哪些操作,同时消除了程序员跟踪存储器地址的需要。简单的数据结构包括整数,实数,布尔值(真/假),以及字符或字符串。通过组合一个或多个数据类型来形成复合数据结构。
最重要的复合数据结构是数组,同类数据集合,以及记录,异构集合。数组可以表示数字向量,字符串列表或向量集合(数组数组或数学矩阵)。记录可以存储员工信息名称,职称和薪水。记录数组(例如员工表)是元素的集合,每个元素都是异构的。相反,记录可能包含一个矢量,即一个数组。
记录组件或字段按名称选择;例如,E.SALARY可能代表记录E的工资字段。数组元素由其位置或索引选择; A [10]是数组A中位置10的元素。因此FOR循环(确定迭代)可以通过具有索引限制的数组(在下面的示例中为FIRST TO LAST)运行,以便对其元素求和:
数组和记录具有固定的大小。 可以增长的结构是使用动态分配构建的,可根据需要提供新的存储。 这些数据结构具有组件,每个组件包含数据和对其他组件的引用(以机器术语,它们的地址)。 这种自引用结构具有递归定义。 例如,bintree(二叉树)要么是空的,要么包含带有数据的根组件以及左右bintree“children”。这样的bintree有效地实现了信息表。 对它们进行操作的子程序自然是递归的; 以下例程打印出bintree的所有元素(每个都是某个子树的根):
抽象数据类型(ADT)对于大规模编程很重要。他们将数据结构和操作打包在其上,隐藏内部细节。例如,ADT表为用户提供插入和查找操作,同时保持底层结构(无论是数组,列表还是二叉树)不可见。在面向对象语言中,类是ADT,对象是它们的实例。下面的面向对象的伪代码示例假定存在ADT bintree和“超类”COMPARABLE,表征存在比较操作的数据(例如整数的“<”)。它定义了一个新的ADT,TABLE,它隐藏了它的数据表示并提供了适合于表的操作。此类根据COMPARABLE类的元素类型参数进行多态定义。它的任何实例都必须指定该类型,这里是一个带有员工数据的类(COMPARABLE声明意味着PERS_REC必须提供比较操作来对记录进行排序)。实现细节被省略。
原文:https://www.cnblogs.com/jinanxiaolaohu/p/11222894.html