1. La relación entre el documento original y la entidad
Puede ser una relación uno a uno, uno a muchos y muchos a muchos. En general, son relaciones uno a uno: es decir, un par de documentos originales deben y solo corresponden a una entidad. En casos especiales, pueden ser relaciones uno a muchos o muchos a uno, es decir, un documento original corresponde a múltiples realidades Cuerpo, o múltiples documentos originales correspondientes a una entidad. La entidad aquí puede entenderse como una tabla básica. Después de aclarar esta correspondencia, diseña para nosotros La interfaz de entrada es muy útil. 〖Ejemplo 1〗: La información de un currículum de empleado corresponde a tres tablas básicas del sistema de información de recursos humanos: tabla de información básica para empleados y sociedad Tabla de relaciones, formulario de currículum de trabajo. Este es un ejemplo típico de "un documento original corresponde a varias entidades". 2. Claves primarias y extranjeras En general, una entidad no puede tener ni una clave primaria ni una llave extranjera. En el diagrama E-R, las entidades en la parte hoja pueden definir la clave primaria, También es posible no definir una clave primaria (porque no tiene hijos), pero debe tener una clave extranjera (porque tiene un padre). El diseño de claves primarias y extranjeras ocupa una posición importante en el diseño de bases de datos globales. Cuando se completa el diseño de la base de datos global, existe un Expertos estadounidenses en diseño de bases de datos dijeron: "Claves, claves por todas partes, nada más que claves", esta es su experiencia en diseño de bases de datos También refleja sus ideas altamente abstractas sobre el núcleo de los sistemas de información (modelos de datos). Porque: la clave primaria es una entidad altamente abstracta, y la clave primaria está asociada a Un par de claves foráneas que representan una conexión entre entidades. 3. La naturaleza de la tabla básica La tabla básica es diferente de la tabla intermedia y de la tabla temporal porque presenta las siguientes cuatro características: (1) Atomicidad. Los campos en la tabla base ya no son descomponibles. (2) Primitividad. Los registros en la tabla base son registros de los datos originales (los datos subyacentes). (3) Deductiva. Todos los datos de salida pueden derivarse de los datos de la tabla base y de la tabla de códigos. (4) Estabilidad. La estructura de la tabla básica es relativamente estable, y los registros de la tabla deben conservarse durante mucho tiempo. Tras comprender la naturaleza de las tablas básicas, al diseñar bases de datos, se pueden distinguir de tablas intermedias y tablas temporales. 4. Estándares paradigmáticos La relación entre la tabla básica y sus campos debe cumplir con el tercer paradigma en la medida de lo posible. Sin embargo, los diseños de bases de datos que cumplen con el tercer paradigma a menudo no lo son El mejor diseño. Para mejorar la eficiencia operativa de las bases de datos, a menudo es necesario reducir el estándar paradigmático: aumentar adecuadamente la redundancia para obtener espacio para el tiempo El propósito de. Ejemplo 2: Existe una tabla básica para el almacenamiento de mercancías, como se muestra en la Tabla 1. La presencia del campo "Importe" indica que la tabla no está diseñada para ser satisfecha El tercer paradigma es suficiente, porque "importe" puede obtenerse multiplicando "precio unitario" por "cantidad", lo que indica que "importe" es un campo redundante. Sin embargo, aumento El campo redundante de "cantidad" puede mejorar la velocidad de las estadísticas de consulta, que es la práctica de intercambiar espacio por tiempo. En Rose 2002, existen dos tipos de columnas prescritas: columnas de datos y columnas calculadas. Una columna como "cantidad" se llama "columna de cálculo", y Columnas como "Precio unitario" y "Cantidad" se llaman "columnas de datos". Tabla 1 Estructura de la tabla de la tabla de mercancías Nombre del producto Modelo Unidad Precio Cantidad TV 29 pulgadas 2.500 40 100.000
5. Entender los tres paradigmas en términos sencillos Comprender los tres paradigmas en términos sencillos es de gran beneficio para el diseño de bases de datos. En el diseño de bases de datos, para aplicar mejor los tres paradigmas, simplemente Hay tres paradigmas que deben entenderse en términos sencillos: El primer paradigma: 1NF es una restricción atómica sobre los atributos, que requiere que los atributos sean atómicos y ya no pueden descomponerse; El segundo paradigma: 2NF es la restricción de unicidad sobre los registros, que requiere que los registros tengan una identificación única, es decir, la unicidad de la entidad; Paradigma 3: 3NF es una restricción sobre la redundancia de campos, es decir, ningún campo puede derivarse de otros campos, requiere que el campo no sea redundante
。 Ningún diseño redundante de bases de datos puede hacerlo. Sin embargo, una base de datos sin redundancia no es necesariamente la mejor base de datos, a veces para mejorar la suerte Para lograr la eficiencia, es necesario reducir el estándar de paradigma y conservar adecuadamente los datos redundantes. El enfoque específico es adherirse al tercer paradigma al diseñar modelos conceptuales de datos , el trabajo de reducción del estándar de paradigma se considera en el diseño del modelo de datos físico. Reducir el paradigma es añadir campos que permitan redundancia. 6. Ser bueno identificando y gestionando correctamente las relaciones de muchos a muchos Si existe una relación de muchos a muchos entre dos entidades, la relación debe eliminarse. La forma de eliminarlo es añadir un tercio real entre ambos cuerpo. De este modo, lo que antes era una relación de muchos a muchos ahora se ha convertido en dos relaciones de uno a muchos. Los atributos de las dos entidades originales deben distribuirse razonablemente Ve a las tres entidades. La tercera entidad aquí es esencialmente una relación más compleja, que corresponde a una tabla básica. En términos generales, los números La herramienta de diseño de bibliotecas no puede reconocer relaciones muchos-a-muchos, pero sí puede manejar relaciones de muchos-a-muchos. Ejemplo 3: En el "Sistema de Información de la Biblioteca", "libro" es una entidad, y "lector" también es una entidad. Estas dos entidades son lo mismo La relación entre libros es típica de muchos a muchos: un libro puede ser tomado prestado por varios lectores en diferentes momentos, y un lector puede tomar prestado más Este libro. Para ello, debería añadirse una tercera entidad entre ambas, llamada "libros de préstamo y devolución", y sus propiedades son: tiempo de préstamo y préstamo También tiene un logotipo (0 significa pedir prestado un libro, 1 significa devolver un libro), además, debe tener dos claves foráneas (la clave primaria de "libro" y la clave primaria de "lector"), de modo que Conecta con los "libros" y los "lectores". 7. El método de valores de la clave primaria PK PK es una herramienta de conexión entre tablas para programadores, que puede ser una cadena de números sin significado físico, que el programa añade automáticamente a 1. Sí es un nombre de campo físicamente significativo o una combinación de nombres de campos. Pero lo primero es mejor que lo segundo. Cuando PK es una combinación de nombres de campos, sugiere un número de campo No cuentes demasiado, ya que el índice no solo ocupa mucho espacio, sino que también se ralentiza. 8. Conseguir la redundancia de datos correctamente La repetición de claves primarias y extranjeras en múltiples tablas no es un concepto de redundancia de datos, y muchas personas no lo conocen 。 ¡La repetición de campos no clave es redundancia de datos! Y es una redundancia de bajo nivel, es decir, redundancia repetitiva. La redundancia avanzada no es basada en campos Repetidamente, pero derivadas de campos. Ejemplo 4: Los tres campos de "precio unitario, cantidad y cantidad" en el producto, "importe" se deriva del "precio unitario" multiplicado por "cantidad" Es redundancia, y es una especie de redundancia avanzada. El propósito de la redundancia es aumentar la velocidad de procesamiento. Solo la redundancia de bajo nivel aumentará el número inconsistencia de los datos, porque los mismos datos pueden introducirse varias veces desde diferentes momentos, lugares y roles. Por ello, abogamos por la redundancia avanzada (pie redundancia por naturaleza), y se opone a la redundancia de bajo nivel (redundancia repetitiva). 9. No existe una respuesta estándar para los diagramas E--R No existe una respuesta estándar al diagrama E-R de un sistema de información, porque su diseño y método de dibujo no son únicos, siempre que cubra el negocio requerido por el sistema El alcance y el contenido funcional son factibles. En su lugar, es necesario modificar el diagrama E-R. Aunque no tiene una única respuesta estándar, no significa que pueda ser arbitraria Diseño. Los criterios para un buen diagrama E-R son: estructura clara, asociación concisa, número moderado de entidades, asignación razonable de atributos y ausencia de redundancia de bajo nivel. 10. Las técnicas de vista son útiles en el diseño de bases de datos A diferencia de tablas básicas, tablas de código y tablas intermedias, las vistas son tablas virtuales que dependen de que existan las tablas reales de la fuente de datos. Las vistas son para programadores Una ventana que utiliza la base de datos es una forma de síntesis de datos de tablas base, un método de procesamiento de datos y una especie de confidencialidad de datos de usuario significa. Para realizar procesamiento complejo, aumentar la velocidad de cálculo y ahorrar espacio de almacenamiento, la profundidad de definición de la vista generalmente no debe superar tres capas. Como tres plantas Si la vista sigue sin ser suficiente, deberías definir una tabla temporal en la vista y luego definir una vista en la tabla temporal. De este modo, la profundidad de la vista se define repetidamente Sin restricciones. Para ciertos sistemas de información relacionados con intereses políticos, económicos, tecnológicos, militares y de seguridad nacionales, el papel de las opiniones es aún más importante. Estos Una vez completado el diseño físico de la tabla básica del sistema, la primera capa de vistas se establece inmediatamente sobre la tabla básica, y el número y la estructura de esta vista de capa son los mismos que la tabla básica El número y la estructura son exactamente los mismos. Y se estipula que todos los programadores solo pueden operar en la vista. Solo el administrador de la base de datos, con La "llave de seguridad" que poseen varias personas puede operarse directamente sobre la mesa básica. Se invita a los lectores a pensar: ¿por qué es esto? 11. Tablas intermedias, sentencias y tablas temporales Una tabla intermedia es una tabla que almacena estadísticas, está diseñada para almacenamiento de datos, informes de salida o resultados de consultas, y a veces no tiene una clave primaria con Claves foráneas (excepto los almacenes de datos). Las tablas temporales son diseñadas por programadores para almacenar registros temporales para uso personal. Las tablas base e intermedia son gestionadas por el DBA Las tablas temporales son mantenidas automáticamente por el propio programador. 12. Las restricciones de integridad se manifiestan en tres aspectos Integridad del dominio: Utiliza Check para implementar restricciones, y en la herramienta de diseño de bases de datos aparece una Ch al definir el rango de valores del campo Botón eck, a través del cual se define la ciudad de valor del campo. Integridad referencial: Implementado con PK, FK y disparadores a nivel de tabla. Integridad definida por el usuario: son algunas reglas de negocio que se implementan con procedimientos almacenados y disparadores. 13. El método para evitar el parcheo de diseño de bases de datos es el principio de los "tres menos" (1) Cuantas menos tablas haya en una base de datos, mejor. Solo si se reduce el número de tablas se puede decir que el diagrama E-R del sistema es pequeño y fino, y se elimina Las entidades duplicadas y redundantes forman un alto grado de abstracción del mundo objetivo, y se realiza una integración sistemática de datos para evitar el diseño de parches; (2) Cuantos menos campos en una tabla combinen claves primarias, mejor. Debido al papel de la clave primaria, uno es construir el índice de clave primaria y el otro servir como subtabla claves extranjeras, por lo que se reduce el número de campos en la combinación de claves primarias, lo que no solo ahorra tiempo de ejecución, sino también espacio de almacenamiento en el índice; (3) Cuantos menos campos haya en una tabla, mejor. Solo un pequeño número de campos indica que no hay duplicación de datos en el sistema Hay poca redundancia de datos y, lo que es más importante, se anima a los lectores a aprender a "cambiar de fila", lo que evita que los campos se incorporen a la tabla principal de la subtabla , dejando muchos campos libres en la tabla principal. La llamada "fila de cambio de columna" consiste en extraer parte del contenido de la tabla principal y construir una separada Submesa. Este método es muy sencillo, hay gente que simplemente no se acostumbra, no lo adopta y no lo implementa. El principio práctico del diseño de bases de datos es encontrar el equilibrio adecuado entre redundancia de datos y velocidad de procesamiento. El "tres menos" es una visión global El pensamiento, las visiones globales, no pueden aislar un principio concreto. El principio es relativo, no absoluto. El principio de "tres más" es definitivamente erróneo. Prueba Piensa: si se cubre la misma función del sistema, el diagrama E-R de 100 entidades (1.000 atributos en total) es definitivamente mejor que el diagrama E-R de 200 entidades (2.000 atributos en total) El diagrama E-R es mucho mejor. Defender el principio de "tres menos" es permitir que los lectores aprendan a utilizar la tecnología de diseño de bases de datos para la integración sistemática de datos. Los pasos para la integración de datos son los siguientes: El sistema de archivos se integra en una base de datos de aplicaciones, la base de datos de aplicaciones se integra en una base de datos de temas y la base de datos de temas se integra en una base de datos global integral. Cuanto mayor es el grado de integración, más fuerte será el intercambio de datos y menos islas de información hay presentes El número de claves primarias y el número de atributos serán menores. El propósito de defender el principio de "tres menos" es evitar que los lectores utilicen tecnología de parches para añadir, eliminar y modificar constantemente la base de datos, con el fin de crear datos empresariales La biblioteca se ha convertido en un "montón de basura" de tablas de bases de datos diseñadas arbitrariamente, o en un "lío" de tablas de bases de datos, y finalmente provoca las tablas y generaciones básicas en la base de datos Las tablas de códigos, las tablas intermedias y las tablas temporales están saturadas e innumerables, lo que resulta en la imposibilidad de mantener y paralizar los sistemas de información de las empresas e instituciones. El principio de "tres más" puede aplicarlo cualquiera, que es la falacia del "método de parcheo" para diseñar bases de datos. El principio de "tres menos" Es un principio de menos pero bien, que requiere altas habilidades en diseño de bases de datos y arte, algo que no todo el mundo puede hacer, porque este principio se elimina La base teórica para diseñar la base de datos utilizando el "método de parcheo". 14. Formas de mejorar la eficiencia en la operación de bases de datos Bajo las condiciones dadas de hardware y software del sistema, los métodos para mejorar la eficiencia operativa del sistema de base de datos son: (1) En el diseño físico de la base de datos, reducir el paradigma, aumentar la redundancia, usar menos disparadores y emplear más procedimientos almacenados. (2) Cuando el cálculo es muy complejo y el número de registros es muy grande (como 10 millones), el cálculo complejo debe estar primero fuera de la base de datos Después de que el método del sistema de archivos se calcula y procesa en lenguaje C++, finalmente se añade a la tabla. Esta es la experiencia del diseño de sistemas de facturación de telecomunicaciones. (3) Si se encuentra que una tabla tiene demasiados registros, como más de 10 millones, la tabla debe dividirse horizontalmente. La práctica de la segmentación horizontal es: Divide el registro de la tabla horizontalmente en dos tablas basándose en un cierto valor de la clave primaria PK de la tabla. Si se encuentra que una tabla tiene demasiados campos, como por ejemplo que exceda Ochenta, la mesa se divide verticalmente y la mesa original se divide en dos tablas. (4) Optimización del sistema de gestión de bases de datos SGBD, es decir, optimización de varios parámetros del sistema, como el número de búferes. (5) Cuando se utilice lenguaje SQL orientado a datos para programar, intente adoptar algoritmos de optimización. En resumen, para mejorar la eficiencia operativa de la base de datos, es necesario optimizar el sistema de la base de datos, el diseño de la base de datos y la implementación del programa , estos tres niveles trabajan duro al mismo tiempo. Las catorce habilidades anteriores son resumidas gradualmente por muchas personas en un gran número de prácticas de análisis y diseño de bases de datos. Por estas experiencias Los lectores no deben ser rígidos ni mecánicos, sino que deben digerir y comprender, buscar la verdad en los hechos y dominar con flexibilidad. Y poco a poco: envía la solicitud exposición, aplicación en desarrollo.
|